<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-06-01T02:18:13Z</responseDate><request verb="GetRecord" identifier="oai:riuma.uma.es:10630/21115" metadataPrefix="qdc">https://riuma.uma.es/rest/oai/request</request><GetRecord><record><header><identifier>oai:riuma.uma.es:10630/21115</identifier><datestamp>2026-02-03T10:22:42Z</datestamp><setSpec>com_10630_1685</setSpec><setSpec>col_10630_38055</setSpec></header><metadata><qdc:qualifieddc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:qdc="http://dspace.org/qualifieddc/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd http://dspace.org/qualifieddc/ http://www.ukoln.ac.uk/metadata/dcmi/xmlschema/qualifieddc.xsd">
   <dc:title>Plantilla parallel_for heterogénea implementada en INTEL ONEAPI</dc:title>
   <dc:creator>Domínguez Berdún, Juan Pedro</dc:creator>
   <dc:contributor>Asenjo-Plaza, Rafael</dc:contributor>
   <dc:subject>Programación en paralelo (Informática)</dc:subject>
   <dc:subject>Ordenadores paralelos</dc:subject>
   <dc:subject>Arquitectura de ordenadores</dc:subject>
   <dc:subject>Informática - Trabajos Fin de Grado</dc:subject>
   <dc:subject>Grado en Ingeniería Informática - Trabajos Fin de Grado</dc:subject>
   <dcterms:abstract>Este trabajo consiste en el desarrollo e implementación de un template de alto&#xd;
nivel, basado en la librería oneTBB de Intel, que permita la ejecución de bucles&#xd;
paralelos de forma heterogénea (Heterogeneous Parallel For). El template se apoya&#xd;
en un planificador llamado LogFit que permite el reparto automático de la carga&#xd;
entre los cores de CPU y la GPU. Se proporciona una implementación basada en&#xd;
oneTBB 2020 que usa las clases Flow Graph con soporte de nodos OpenCL, y&#xd;
otra basada en oneAPI/SYCL y oneTBB 2021 que permite mantener en el mismo&#xd;
fuente el código de GPU y el de CPU. Este nuevo template permite la ejecución de&#xd;
forma fácil y eficiente de bucles paralelos sobre plataformas heterogéneas CPU GPU, simplemente proporcionándole el rango de iteraciones del bucle, la función&#xd;
a ejecutar en CPU (en caso de ser este el dispositivo elegido para ejecutar un&#xd;
subrango de las mismas) y el kernel (en lenguaje OpenCL o en SYCL) a ejecutar&#xd;
en la GPU (en caso de ser esta la elegida).&#xd;
Además de la implementación del template y la comprobación de su correcto&#xd;
funcionamiento, se ha realizado una comparación de rendimientos entre distintas&#xd;
implementaciones de dos kernels computacionales. Además del rendimiento se ha&#xd;
evaluado tanto la sobrecarga de la nueva abstracción y la reducción del esfuerzo&#xd;
de programación.</dcterms:abstract>
   <dcterms:dateAccepted>2021-03-15T07:23:05Z</dcterms:dateAccepted>
   <dcterms:available>2021-03-15T07:23:05Z</dcterms:available>
   <dcterms:created>2021-03-15T07:23:05Z</dcterms:created>
   <dcterms:issued>2021</dcterms:issued>
   <dc:type>bachelor thesis</dc:type>
   <dc:identifier>https://hdl.handle.net/10630/21115</dc:identifier>
   <dc:language>spa</dc:language>
   <dc:rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</dc:rights>
   <dc:rights>open access</dc:rights>
   <dc:rights>Attribution-NonCommercial-NoDerivatives 4.0 Internacional</dc:rights>
</qdc:qualifieddc>
</metadata></record></GetRecord></OAI-PMH>