<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-28T07:59:21Z</responseDate><request verb="GetRecord" identifier="oai:riuma.uma.es:10630/20718" metadataPrefix="marc">https://riuma.uma.es/rest/oai/request</request><GetRecord><record><header><identifier>oai:riuma.uma.es:10630/20718</identifier><datestamp>2026-02-03T10:26:35Z</datestamp><setSpec>com_10630_1685</setSpec><setSpec>col_10630_38055</setSpec></header><metadata><record xmlns="http://www.loc.gov/MARC21/slim" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd">
   <leader>00925njm 22002777a 4500</leader>
   <datafield ind2=" " ind1=" " tag="042">
      <subfield code="a">dc</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="720">
      <subfield code="a">García Carrasco, Alejandro Jesús</subfield>
      <subfield code="e">author</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="260">
      <subfield code="c">2021-01-18</subfield>
   </datafield>
   <datafield ind2=" " ind1=" " tag="520">
      <subfield code="a">Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje por&#xd;
refuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por el&#xd;
framework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos.&#xd;
Para ello, una vez implementados los distintos algoritmos, se ejecutarán un número&#xd;
determinado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer una&#xd;
comparativa sobre las mismas condiciones.&#xd;
El código a desarrollar se podría dividir principalmente en dos partes, el Agente contiene&#xd;
la mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegar&#xd;
encontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datos&#xd;
del entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en forma&#xd;
de tabla para poder hacer una mejor comparativa.&#xd;
Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así como&#xd;
diversas librerías y el entorno PyCharm</subfield>
   </datafield>
   <datafield ind1="8" ind2=" " tag="024">
      <subfield code="a">https://hdl.handle.net/10630/20718</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Algoritmos computacionales</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Interacción hombre-ordenador</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Aprendizaje automático (Inteligencia artificial)</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Informática - Trabajos Fin de Grado</subfield>
   </datafield>
   <datafield tag="653" ind2=" " ind1=" ">
      <subfield code="a">Grado en Ingeniería Informática - Trabajos Fin de Grado</subfield>
   </datafield>
   <datafield ind2="0" ind1="0" tag="245">
      <subfield code="a">Estudio experimental de diversos algoritmos de aprendizaje por refuerzo</subfield>
   </datafield>
</record>
</metadata></record></GetRecord></OAI-PMH>