<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-27T23:27:06Z</responseDate><request verb="GetRecord" identifier="oai:riuma.uma.es:10630/20718" metadataPrefix="mods">https://riuma.uma.es/rest/oai/request</request><GetRecord><record><header><identifier>oai:riuma.uma.es:10630/20718</identifier><datestamp>2026-02-03T10:26:35Z</datestamp><setSpec>com_10630_1685</setSpec><setSpec>col_10630_38055</setSpec></header><metadata><mods:mods xmlns:doc="http://www.lyncode.com/xoai" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
   <mods:name>
      <mods:namePart>García Carrasco, Alejandro Jesús</mods:namePart>
   </mods:name>
   <mods:extension>
      <mods:dateAvailable encoding="iso8601">2021-01-18T07:37:37Z</mods:dateAvailable>
   </mods:extension>
   <mods:extension>
      <mods:dateAccessioned encoding="iso8601">2021-01-18T07:37:37Z</mods:dateAccessioned>
   </mods:extension>
   <mods:originInfo>
      <mods:dateIssued encoding="iso8601">2021-01-18</mods:dateIssued>
   </mods:originInfo>
   <mods:identifier type="uri">https://hdl.handle.net/10630/20718</mods:identifier>
   <mods:abstract>Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje por&#xd;
refuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por el&#xd;
framework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos.&#xd;
Para ello, una vez implementados los distintos algoritmos, se ejecutarán un número&#xd;
determinado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer una&#xd;
comparativa sobre las mismas condiciones.&#xd;
El código a desarrollar se podría dividir principalmente en dos partes, el Agente contiene&#xd;
la mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegar&#xd;
encontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datos&#xd;
del entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en forma&#xd;
de tabla para poder hacer una mejor comparativa.&#xd;
Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así como&#xd;
diversas librerías y el entorno PyCharm</mods:abstract>
   <mods:language>
      <mods:languageTerm>spa</mods:languageTerm>
   </mods:language>
   <mods:accessCondition type="useAndReproduction">http://creativecommons.org/licenses/by-nc-nd/4.0/</mods:accessCondition>
   <mods:accessCondition type="useAndReproduction">open access</mods:accessCondition>
   <mods:accessCondition type="useAndReproduction">Attribution-NonCommercial-NoDerivatives 4.0 Internacional</mods:accessCondition>
   <mods:subject>
      <mods:topic>Algoritmos computacionales</mods:topic>
   </mods:subject>
   <mods:subject>
      <mods:topic>Interacción hombre-ordenador</mods:topic>
   </mods:subject>
   <mods:subject>
      <mods:topic>Aprendizaje automático (Inteligencia artificial)</mods:topic>
   </mods:subject>
   <mods:subject>
      <mods:topic>Informática - Trabajos Fin de Grado</mods:topic>
   </mods:subject>
   <mods:subject>
      <mods:topic>Grado en Ingeniería Informática - Trabajos Fin de Grado</mods:topic>
   </mods:subject>
   <mods:titleInfo>
      <mods:title>Estudio experimental de diversos algoritmos de aprendizaje por refuerzo</mods:title>
   </mods:titleInfo>
   <mods:genre>bachelor thesis</mods:genre>
</mods:mods>
</metadata></record></GetRecord></OAI-PMH>