
- RIUMA Principal
- Listar por autor
Listar por autor "Ruiz-Montiel, Manuela"
Mostrando ítems 1-6 de 6
-
Aproximación Funcional en Aprendizaje por Refuerzo Multi-Objetivo
Ruiz-Montiel, Manuela (AEPIA, 2015)Describimos y comparamos dos t ecnicas para combinar m etodos de aproximaci on funcional y de escalarizaci on, con el objetivo de resolver problemas de aprendizaje por refuerzo con espacios de estados de tama~no elevado y ... -
Gramáticas difusas de formas
Perez-de-la-Cruz-Molina, Jose Luis; Mandow-Andaluz, Lorenzo
; López-Romero, Fernando
; Ruiz-Montiel, Manuela (AEPIA, 2015)
Presentamos una generalización difusa del concepto de computacion o derivacion en una gramática de formas. Primeramente presentamos las ideas en abstracto y posteriormente describimos una implementacion software y algunos ... -
Multi-objective Reinforcement Learning
Ruiz-Montiel, Manuela (2013-09-25)In this talk we present PQ-learning, a new Reinforcement Learning (RL) algorithm that determines the rational behaviours of an agent in multi-objective domains -
PQ-learning: aprendizaje por refuerzo multiobjetivo
En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje ... -
Proyecto Arquitectónico Energéticamente Eficiente Mediante Gramáticas de Formas y Aprendizaje por Refuerzo
Gavilanes-Velaz-de-Medrano, Juan; Hidalgo, Pablo; Belmonte, David; Mandow-Andaluz, Lorenzo
; Ruiz-Montiel, Manuela (AEPIA, 2015)
En este trabajo presentamos un sistema para la generación de esquemas de viviendas unifamiliares energéticamente eficientes. Los esquemas se sintetizan mediante la ejecución de gramáticas de formas simples, entrenadas por ... -
A temporal difference method for multi-objective reinforcement learning
This work describes MPQ-learning, an temporal-difference method that approximates the set of all non-dominated policies in multi-objective Markov decision problems, where rewards are vectors and each component stands for ...