
- RIUMA Principal
- Listar por autor
Listar por autor "Mandow-Andaluz, Lorenzo"
Mostrando ítems 1-20 de 20
-
Algoritmos de búsqueda con retroceso para problemas multicriterio
Coego-Botana, Javier(Servicio de Publicaciones y Divulgación Científica, 2015)
La búsqueda en grafos, con multitud de aplicaciones en el mundo real, ha propiciado el diseño de una gran cantidad de algoritmos centrados en el procesamiento de un único objetivo, magnitud representativa del coste. Sin ... -
An Analysis of Some Algorithms and Heuristics for Multiobjective Graph Search
Machuca Sánchez, Enrique (2012-09-07)Many real problems require the examination of an exponential number of alternatives in order to find the best choice. They are the so-called combinatorial optimization problems. Besides, real problems usually involve the ... -
An evaluation of best compromise search in graphs
Machuca, Enrique; Mandow-Andaluz, Lorenzo; Galand, Lucie (Springer, 2013-09)
This work evaluates two different approaches for multicriteria graph search problems using compromise preferences. This approach focuses search on a single solution that represents a balanced tradeoff between objectives, ... -
Análisis de algoritmos de inteligencia artificial para videojuegos
Rico Zambrana, David (2017-03-23)Este documento contiene el Trabajo de Fin de Grado del alumno David Rico Zam- brana, estudiante del Grado en Ingeniería del Software, en la Universidad de Málaga. Este trabajo se ha realizado bajo la tutorización de ... -
Búsqueda multiobjetivo basada en RBFS y punto ideal
Muchos problemas reales precisan del tratamiento simultáneo de objetivos contrapuestos, donde la mejora de la calidad de uno de ellos conlleva el empeoramiento de otros. Este artículo presenta RIPS, un algoritmo multiobjetivo ... -
Comparación de algoritmos de pathfinding
Infante Paredes, Sergio (2021-06)El problema de la búsqueda de caminos o pathfinding es muy recurrente en el mundo de los videojuegos. Estos en muchas ocasiones, tienen personajes que ya sea el jugador o la máquina determinan hacia adonde tienen que ir ... -
Desarrollo del juego del Backgammon con integración de técnicas de aprendizaje por refuerzo
Tineo Bravo, Sergio (2019-12-12)Este documento representa el trabajo fin de grado sobre el diseño, desarrollo e implementación del juego Backgammon. Así como la integración de técnicas de aprendizaje por refuerzo en lenguaje Python. El programa podrá ... -
Design with shapes grammars and reinforcement learning.
Ruiz-Montiel, Manuela; Boned-Purkiss, Francisco Javier; Gavilanes-Velaz-de-Medrano, Juan
; Jiménez-Morales, Eduardo
; Mandow-Andaluz, Lorenzo
; Pérez-de-la-Cruz-Molina, José Luis
[et al.] (Elsevier, 2013-01)
Shape grammars are a powerful and appealing formalism for automatic shape generation in computer-based design systems. This paper presents a proposal complementing the generative power of shape grammars with reinforcement ... -
Gramáticas difusas de formas
Pérez-de-la-Cruz-Molina, José Luis; Mandow-Andaluz, Lorenzo
; López-Romero, Fernando
; Ruiz-Montiel, Manuela (AEPIA, 2015)
Presentamos una generalización difusa del concepto de computacion o derivacion en una gramática de formas. Primeramente presentamos las ideas en abstracto y posteriormente describimos una implementacion software y algunos ... -
Improving Bi-Objective Shortest Path Search with Early Pruning.
Bi-objective search problems are a useful generalization of shortest path search. This paper reviews some recent contributions for the solution of this problem with emphasis on the efficiency of the dominance checks ... -
Multi-objective bandit algorithms with Chebyshev scalarization.
In this paper we analyze several alternatives for Chebyshev scalarization in multi-objective bandit problems. The alternatives are evaluated on a reference bi-objective benchmark problem of Pareto frontier approximation. ... -
Multi-objective dynamic programming with limited precision
Mandow-Andaluz, Lorenzo; Pérez-de-la-Cruz-Molina, José Luis
; Pozas García, Nicolás (Springer, 2021-11-02)
This paper addresses the problem of approximating the set of all solutions for Multi-objective Markov Decision Processes. We show that in the vast majority of interesting cases, the number of solutions is exponential or ... -
New Techniques and Algorithms for Multiobjective and Lexicographic Goal-Based Shortest Path Problems
Pulido Arrebola, Francisco Javier (Servicio de Publicaciones y Divulgación Científica, 2015)Shortest Path Problems (SPP) are one of the most extensively studied problems in the fields of Artificial Intelligence (AI) and Operations Research (OR). It consists in finding the shortest path between two given nodes in ... -
PQ-learning: aprendizaje por refuerzo multiobjetivo
En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje ... -
Programación de espacios de estados con Java en asignaturas de inteligencia artificial
Mandow-Andaluz, Lorenzo(2015-09-04)
La representación mediante espacios de estados es un elemento central en los cursos sobre inteligencia artificial simbólica. Las prácticas de programación resultan muy importantes para la asimilación de este concepto. En ... -
Proyecto Arquitectónico Energéticamente Eficiente Mediante Gramáticas de Formas y Aprendizaje por Refuerzo
Gavilanes-Velaz-de-Medrano, Juan; Hidalgo, Pablo; Belmonte, David; Mandow-Andaluz, Lorenzo
; Ruiz-Montiel, Manuela (AEPIA, 2015)
En este trabajo presentamos un sistema para la generación de esquemas de viviendas unifamiliares energéticamente eficientes. Los esquemas se sintetizan mediante la ejecución de gramáticas de formas simples, entrenadas por ... -
Pruning dominated policies in multiobjective Pareto Q-learning
Mandow-Andaluz, Lorenzo; Pérez-de-la-Cruz-Molina, José Luis
(2019-10-18)
The solution for a Multi-Objetive Reinforcement Learning problem is a set of Pareto optimal policies. MPQ-learning is a recent algorithm that approximates the whole set of all Pareto-optimal deterministic policies by ... -
Randomness and control in design processes: an empirical study with architecture students.
Belmonte-Martínez, María Victoria; Millán-Valldeperas, Eva
; Ruiz-Montiel, Manuela; Badillo, Reyes; Boned-Purkiss, Francisco Javier
; Mandow-Andaluz, Lorenzo
; Pérez-de-la-Cruz-Molina, José Luis
[et al.] (2014-02-12)
The aim of this study is to explore designers' preferences between randomness and control in the generation of architectural forms. To this end, a generative computer tool was implemented that allows both random and ... -
Simulador para el aprendizaje del algoritmo de PATHFINDING HPA*
Díaz Roldán, David (2022-06)El problema de búsqueda de caminos en tiempo real es de suma importancia en los videojuegos. El coste computacional requerido por el algoritmo A*, uno de los más conocidos, aumenta considerablemente cuanto mayor es el ... -
A temporal difference method for multi-objective reinforcement learning
This work describes MPQ-learning, an temporal-difference method that approximates the set of all non-dominated policies in multi-objective Markov decision problems, where rewards are vectors and each component stands for ...