• Búsqueda multiobjetivo basada en RBFS y punto ideal 

      Coego-Botana, Javier; Mandow-Andaluz, Lorenzo; Perez-de-la-Cruz-Molina, Jose Luis (2016-10-07)
      Muchos problemas reales precisan del tratamiento simultáneo de objetivos contrapuestos, donde la mejora de la calidad de uno de ellos conlleva el empeoramiento de otros. Este artículo presenta RIPS, un algoritmo multiobjetivo ...
    • Comparación de algoritmos de aprendizaje por refuerzo basados en Q-Learning 

      Caponera De Cobellis, Romolo Rosario (2021-06)
      El presente Trabajo de Fin de Grado se centra en el Aprendizaje por Refuerzo, y más concretamente en el algoritmo QLearning[1], comparando tres de sus variantes más populares (Épsilon-greedy [2], SoftMax [3] y Upper ...
    • Context-aware Assessment Using QR-codes 

      Conejo-Muñoz, Ricardo Jose; Perez-de-la-Cruz-Molina, Jose Luis; Barros-Blanco, Beatriz; Galvez, Jaime; Garcia-Viñas, Juan Ignacio (SAGE, 2013)
      In this paper we present the implementation of a general mechanism to deliver tests based on mobile devices and matrix codes. The system is an extension of Siette, and has not been specifically developed for any subject ...
    • Estudio experimental de diversos algoritmos de aprendizaje por refuerzo 

      García Carrasco, Alejandro Jesús (2021-01-18)
      Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje por refuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por el framework OpenAI Gym [1] y hacer una comparativa ...
    • Gramáticas difusas de formas 

      Perez-de-la-Cruz-Molina, Jose Luis; Mandow-Andaluz, Lorenzo; López-Romero, Fernando; Ruiz-Montiel, Manuela (AEPIA, 2015)
      Presentamos una generalización difusa del concepto de computacion o derivacion en una gramática de formas. Primeramente presentamos las ideas en abstracto y posteriormente describimos una implementacion software y algunos ...
    • Learning Bayesian Networks for Student Modeling 

      Millan-Valldeperas, Eva; Belmonte-Martinez, Maria Victoria; Jiménez, Guiomar; Perez-de-la-Cruz-Molina, Jose Luis (2015-07-03)
      In the last decade, there has been a growing interest in using Bayesian Networks (BN) in the student modelling problem. This increased interest is probably due to the fact that BNs provide a sound methodology for this ...
    • Multi-objective dynamic programming with limited precision 

      Mandow-Andaluz, Lorenzo; Perez-de-la-Cruz-Molina, Jose Luis; Pozas García, Nicolás (Springer, 2021-11-02)
      This paper addresses the problem of approximating the set of all solutions for Multi-objective Markov Decision Processes. We show that in the vast majority of interesting cases, the number of solutions is exponential or ...
    • New computational techniques for detecting, learning and managing criteria in design problems 

      Ruiz Montiel, Manuela (UMA Editorial, 2016)
      Los problemas de diseño suelen involucrar la consideración de criterios de diferente naturaleza, incluyendo necesidades técnicas, económicas, sociales y medioambientales, entre otras. Las herramientas CAD tradicionales ...
    • PQ-learning: aprendizaje por refuerzo multiobjetivo 

      Ruiz-Montiel, Manuela; Mandow-Andaluz, Lorenzo; Perez-de-la-Cruz-Molina, Jose Luis (2013-09)
      En este artí culo describimos y analizamos PQ-learning, un algoritmo para problemas de aprendizaje por refuerzo multiobjetivo. El algoritmo es una extensi ón de Q-learning, un algoritmo para problemas de aprendizaje ...
    • Pruning dominated policies in multiobjective Pareto Q-learning 

      Mandow-Andaluz, Lorenzo; Perez-de-la-Cruz-Molina, Jose Luis (2019-10-18)
      The solution for a Multi-Objetive Reinforcement Learning problem is a set of Pareto optimal policies. MPQ-learning is a recent algorithm that approximates the whole set of all Pareto-optimal deterministic policies by ...
    • A temporal difference method for multi-objective reinforcement learning 

      Ruiz-Montiel, Manuela; Mandow-Andaluz, Lorenzo; Perez-de-la-Cruz-Molina, Jose Luis (2019-10-17)
      This work describes MPQ-learning, an temporal-difference method that approximates the set of all non-dominated policies in multi-objective Markov decision problems, where rewards are vectors and each component stands for ...
    • Using machine learning techniques for architectural design tracking: an experimental study of the design of a shelter 

      Millan-Valldeperas, Eva; Belmonte-Martinez, Maria Victoria; Boned-Purkiss, Francisco Javier; Gavilanes-Velaz-de-Medrano, Juan; Perez-de-la-Cruz-Molina, Jose Luis; [et al.] (Elsevier, 2022)
      In this paper, we present a study aimed at tracking and analysing the design process. More concretely, we intend to explore whether some elements of the conceptual design stage in architecture might have an influence on ...