PQ-learning: aprendizaje por refuerzo multiobjetivo
| dc.centro | E.T.S.I. Informática | es_ES |
| dc.contributor.author | Ruiz-Montiel, Manuela | |
| dc.contributor.author | Mandow-Andaluz, Lorenzo | |
| dc.contributor.author | Pérez-de-la-Cruz-Molina, José Luis | |
| dc.date.accessioned | 2013-09-25T11:41:27Z | |
| dc.date.available | 2013-09-25T11:41:27Z | |
| dc.date.issued | 2013-09 | |
| dc.departamento | Lenguajes y Ciencias de la Computación | |
| dc.description.abstract | En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje por refuerzo escalares. Al contrario que otros algoritmos, PQ-learning no requiere informaci ón de preferencias sobre los objetivos, es aplicable a problemas con fronteras de Pareto no convexas y permite recuperar a partir de los Q-valores las secuencias de acci ón correspondientes a diferentes polí ticas Pareto- óptimas. PQ-learning ha sido aplicado a dos problemas pertenecientes a un banco de pruebas propuesto en la literatura de aprendizaje por refuerzo multiobjetivo | es_ES |
| dc.description.sponsorship | Este trabajo está parcialmente fi nanciado por el Plan Nacional de I+D+I, proyecto TIN2009-14179 (Gobierno de España, Ministerio de Ciencia e Innovaci ón) y por la Universidad de M álaga, Campus de Excelencia Internacional Andaluc ía Tech. Manuela Ruiz-Montiel disfruta de una beca FPU (Gobierno de España, Ministerio de Educación) | es_ES |
| dc.identifier.isbn | 978-84-695-8348-7 | |
| dc.identifier.uri | http://hdl.handle.net/10630/5908 | |
| dc.language.iso | spa | es_ES |
| dc.rights.accessRights | open access | |
| dc.subject | Aprendizaje | es_ES |
| dc.subject.other | Aprendizaje por refuerzo | es_ES |
| dc.subject.other | Q-learning | es_ES |
| dc.subject.other | Optimización multiobjetivo | es_ES |
| dc.title | PQ-learning: aprendizaje por refuerzo multiobjetivo | es_ES |
| dc.type | journal article | es_ES |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | b4b11711-73ab-4cd0-854c-8ab2735e829d | |
| relation.isAuthorOfPublication | b7e65043-46cc-445b-8d8f-b4c7ad4f1c06 | |
| relation.isAuthorOfPublication.latestForDiscovery | b4b11711-73ab-4cd0-854c-8ab2735e829d |
Files
Original bundle
1 - 1 of 1

