<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-06-01T19:48:42Z</responseDate><request verb="GetRecord" identifier="oai:riuma.uma.es:10630/7465" metadataPrefix="qdc">https://riuma.uma.es/rest/oai/request</request><GetRecord><record><header><identifier>oai:riuma.uma.es:10630/7465</identifier><datestamp>2026-02-03T12:31:17Z</datestamp><setSpec>com_10630_2254</setSpec><setSpec>col_10630_37959</setSpec></header><metadata><qdc:qualifieddc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:qdc="http://dspace.org/qualifieddc/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd http://dspace.org/qualifieddc/ http://www.ukoln.ac.uk/metadata/dcmi/xmlschema/qualifieddc.xsd">
   <dc:title>Acelerando los momentos de Zernike sobre Kepler</dc:title>
   <dc:creator>Ruiz, Antonio</dc:creator>
   <dc:creator>Ujaldon-Martínez, Manuel</dc:creator>
   <dc:subject>Arquitectura de ordenadores</dc:subject>
   <dcterms:abstract>Este trabajo analiza las características más avanzadas de la arquitectura Kepler de Nvidia,&#xd;
 principalmente el paralelismo dinámico para el lanzamiento de kernels desde la GPU &#xd;
 y la planificación de hilos con Hyper-Q. Posteriormente, ilustra diversas formas &#xd;
 de aprovecharlas en un código que computa los momentos de Zernike, y que admite&#xd;
 formulaciones directa y recursiva. Hemos podido así contrastar las posibilidades &#xd;
 que ambas ofrecen para maximizar rendimiento en las nuevas GPUs, la primera desplegando&#xd;
 todo el paralelismo, y la segunda aumentando la intensidad aritmética gracias a la&#xd;
 amortización de resultados procedentes de iteraciones previas. Esto nos ha permitido &#xd;
 aumentar los factores de aceleración que ya logramos anteriormente con arquitecturas &#xd;
 Fermi frente a la versión C ejecutada en una CPU multicore de su misma generación.&#xd;
 Logramos también identificar la carga de trabajo crítica que necesita un código&#xd;
 para mejorar su ejecución en las nuevas plataformas dotadas de seis veces más núcleos&#xd;
 computacionales, y cuantificar la sobrecarga introducida por los nuevos mecanismos&#xd;
 de programación dinámica en CUDA.</dcterms:abstract>
   <dcterms:dateAccepted>2014-05-02T09:52:39Z</dcterms:dateAccepted>
   <dcterms:available>2014-05-02T09:52:39Z</dcterms:available>
   <dcterms:created>2014-05-02T09:52:39Z</dcterms:created>
   <dcterms:issued>2014-05-02</dcterms:issued>
   <dc:type>conference output</dc:type>
   <dc:identifier>http://hdl.handle.net/10630/7465</dc:identifier>
   <dc:language>spa</dc:language>
   <dc:relation>Primeras Jornadas de Programación Paralela y Multicore</dc:relation>
   <dc:relation>Granada (España)</dc:relation>
   <dc:relation>Febrero de 2014</dc:relation>
   <dc:rights>open access</dc:rights>
</qdc:qualifieddc>
</metadata></record></GetRecord></OAI-PMH>