<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-27T05:36:28Z</responseDate><request verb="GetRecord" identifier="oai:riuma.uma.es:10630/7465" metadataPrefix="rdf">https://riuma.uma.es/rest/oai/request</request><GetRecord><record><header><identifier>oai:riuma.uma.es:10630/7465</identifier><datestamp>2026-02-03T12:31:17Z</datestamp><setSpec>com_10630_2254</setSpec><setSpec>col_10630_37959</setSpec></header><metadata><rdf:RDF xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:ds="http://dspace.org/ds/elements/1.1/" xmlns:ow="http://www.ontoweb.org/ontology/1#" xmlns:rdf="http://www.openarchives.org/OAI/2.0/rdf/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/rdf/ http://www.openarchives.org/OAI/2.0/rdf.xsd">
   <ow:Publication rdf:about="oai:riuma.uma.es:10630/7465">
      <dc:title>Acelerando los momentos de Zernike sobre Kepler</dc:title>
      <dc:creator>Ruiz, Antonio</dc:creator>
      <dc:creator>Ujaldon-Martínez, Manuel</dc:creator>
      <dc:subject>Arquitectura de ordenadores</dc:subject>
      <dc:description>Este trabajo analiza las características más avanzadas de la arquitectura Kepler de Nvidia,&#xd;
 principalmente el paralelismo dinámico para el lanzamiento de kernels desde la GPU &#xd;
 y la planificación de hilos con Hyper-Q. Posteriormente, ilustra diversas formas &#xd;
 de aprovecharlas en un código que computa los momentos de Zernike, y que admite&#xd;
 formulaciones directa y recursiva. Hemos podido así contrastar las posibilidades &#xd;
 que ambas ofrecen para maximizar rendimiento en las nuevas GPUs, la primera desplegando&#xd;
 todo el paralelismo, y la segunda aumentando la intensidad aritmética gracias a la&#xd;
 amortización de resultados procedentes de iteraciones previas. Esto nos ha permitido &#xd;
 aumentar los factores de aceleración que ya logramos anteriormente con arquitecturas &#xd;
 Fermi frente a la versión C ejecutada en una CPU multicore de su misma generación.&#xd;
 Logramos también identificar la carga de trabajo crítica que necesita un código&#xd;
 para mejorar su ejecución en las nuevas plataformas dotadas de seis veces más núcleos&#xd;
 computacionales, y cuantificar la sobrecarga introducida por los nuevos mecanismos&#xd;
 de programación dinámica en CUDA.</dc:description>
      <dc:date>2014-05-02T09:52:39Z</dc:date>
      <dc:date>2014-05-02T09:52:39Z</dc:date>
      <dc:date>2014-02-07</dc:date>
      <dc:date>2014-05-02</dc:date>
      <dc:type>conference output</dc:type>
      <dc:identifier>http://hdl.handle.net/10630/7465</dc:identifier>
      <dc:language>spa</dc:language>
      <dc:relation>Primeras Jornadas de Programación Paralela y Multicore</dc:relation>
      <dc:relation>Granada (España)</dc:relation>
      <dc:relation>Febrero de 2014</dc:relation>
      <dc:rights>open access</dc:rights>
   </ow:Publication>
</rdf:RDF>
</metadata></record></GetRecord></OAI-PMH>