PQ-learning: aprendizaje por refuerzo multiobjetivo

Ruiz-Montiel, Manuela; Mandow-Andaluz, Lorenzo; Pérez-de-la-Cruz-Molina, José Luis

PQ-learning: aprendizaje por refuerzo multiobjetivo

Files

CAEPIA13.pdf (383.37 KB)

Identifiers

URI: http://hdl.handle.net/10630/5908

ISBN: 978-84-695-8348-7

Publication date

2013-09

Authors

Ruiz-Montiel, Manuela

Mandow-Andaluz, Lorenzo

Pérez-de-la-Cruz-Molina, José Luis

Metrics

Share

Export

Center

E.T.S.I. Informática

Department/Institute

Lenguajes y Ciencias de la Computación

Keywords

Aprendizaje

Abstract

En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje por refuerzo escalares. Al contrario que otros algoritmos, PQ-learning no requiere informaci ón de preferencias sobre los objetivos, es aplicable a problemas con fronteras de Pareto no convexas y permite recuperar a partir de los Q-valores las secuencias de acci ón correspondientes a diferentes polí ticas Pareto- óptimas. PQ-learning ha sido aplicado a dos problemas pertenecientes a un banco de pruebas propuesto en la literatura de aprendizaje por refuerzo multiobjetivo

Collections

Artículos

Full item page

PQ-learning: aprendizaje por refuerzo multiobjetivo

Files

Identifiers

Publication date

Reading date

Authors

Collaborators

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Share

Export

Research Projects

Organizational Units

Journal Issue

Center

Department/Institute

Keywords

Abstract

Description

Bibliographic citation

Collections

Endorsement

Review

Supplemented By

Referenced by