Mostrar el registro sencillo del ítem

dc.contributor.authorRuiz-Montiel, Manuela
dc.contributor.authorMandow-Andaluz, Lorenzo 
dc.contributor.authorPérez-de-la-Cruz-Molina, José Luis 
dc.date.accessioned2013-09-25T11:41:27Z
dc.date.available2013-09-25T11:41:27Z
dc.date.issued2013-09
dc.identifier.isbn978-84-695-8348-7
dc.identifier.urihttp://hdl.handle.net/10630/5908
dc.description.abstractEn este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje por refuerzo escalares. Al contrario que otros algoritmos, PQ-learning no requiere informaci ón de preferencias sobre los objetivos, es aplicable a problemas con fronteras de Pareto no convexas y permite recuperar a partir de los Q-valores las secuencias de acci ón correspondientes a diferentes polí ticas Pareto- óptimas. PQ-learning ha sido aplicado a dos problemas pertenecientes a un banco de pruebas propuesto en la literatura de aprendizaje por refuerzo multiobjetivoes_ES
dc.description.sponsorshipEste trabajo está parcialmente fi nanciado por el Plan Nacional de I+D+I, proyecto TIN2009-14179 (Gobierno de España, Ministerio de Ciencia e Innovaci ón) y por la Universidad de M álaga, Campus de Excelencia Internacional Andaluc ía Tech. Manuela Ruiz-Montiel disfruta de una beca FPU (Gobierno de España, Ministerio de Educación)es_ES
dc.language.isospaes_ES
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectAprendizajees_ES
dc.subject.otherAprendizaje por refuerzoes_ES
dc.subject.otherQ-learninges_ES
dc.subject.otherOptimización multiobjetivoes_ES
dc.titlePQ-learning: aprendizaje por refuerzo multiobjetivoes_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.centroE.T.S.I. Informáticaes_ES


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem