Mostrar el registro sencillo del ítem
PQ-learning: aprendizaje por refuerzo multiobjetivo
dc.contributor.author | Ruiz-Montiel, Manuela | |
dc.contributor.author | Mandow-Andaluz, Lorenzo | |
dc.contributor.author | Pérez-de-la-Cruz-Molina, José Luis | |
dc.date.accessioned | 2013-09-25T11:41:27Z | |
dc.date.available | 2013-09-25T11:41:27Z | |
dc.date.issued | 2013-09 | |
dc.identifier.isbn | 978-84-695-8348-7 | |
dc.identifier.uri | http://hdl.handle.net/10630/5908 | |
dc.description.abstract | En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje por refuerzo escalares. Al contrario que otros algoritmos, PQ-learning no requiere informaci ón de preferencias sobre los objetivos, es aplicable a problemas con fronteras de Pareto no convexas y permite recuperar a partir de los Q-valores las secuencias de acci ón correspondientes a diferentes polí ticas Pareto- óptimas. PQ-learning ha sido aplicado a dos problemas pertenecientes a un banco de pruebas propuesto en la literatura de aprendizaje por refuerzo multiobjetivo | es_ES |
dc.description.sponsorship | Este trabajo está parcialmente fi nanciado por el Plan Nacional de I+D+I, proyecto TIN2009-14179 (Gobierno de España, Ministerio de Ciencia e Innovaci ón) y por la Universidad de M álaga, Campus de Excelencia Internacional Andaluc ía Tech. Manuela Ruiz-Montiel disfruta de una beca FPU (Gobierno de España, Ministerio de Educación) | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.subject | Aprendizaje | es_ES |
dc.subject.other | Aprendizaje por refuerzo | es_ES |
dc.subject.other | Q-learning | es_ES |
dc.subject.other | Optimización multiobjetivo | es_ES |
dc.title | PQ-learning: aprendizaje por refuerzo multiobjetivo | es_ES |
dc.type | info:eu-repo/semantics/article | es_ES |
dc.centro | E.T.S.I. Informática | es_ES |