Actualmente, el aprendizaje profundo (deep learning ) constituye una de las tecnologías del campo de la Inteligencia Artificial (IA) que goza de mayor éxito y popularidad. En campos como el procesamiento de imágenes y el análisis de datos secuenciales, su uso se encuentra bastante extendido, formando parte del núcleo de sistemas de vanguardia como los vehículos de conducción automática o los sistemas de reconocimiento facial. Sin embargo, y a pesar de sus grandes capacidades representacionales y predictivas, su aplicación a problemas, como el análisis de datos de expresión para su empleo en tareas de clasificación de cáncer, en los que el nu´mero de variables (N) supera con creces el nu´mero de muestras (M) o patrones del conjunto de datos (N » M), constituye un verdadero reto todavía sin resolver. Con el objetivo de resolver este problema entre el número de variables y de muestras, diferentes ténicas de aprendizaje automático de reducción de la dimensionalidad de los datos han sido aplicadas. Aunque esta técnicas consiguen reducir el número de variables, el rendimiento en predicción de los modelos de aprendizaje automático tradicionales es moderado, ya que el número reducido de muestras empleado para el entrenamiento de los métodos de reducción de la dimensionalidad no les permite extraer las características adecuadas para mejorar el rendimiento en predicción de forma significativa. Para resolver estos problemas y mejorar la habilidad predictiva de los métodos clásicos de aprendizaje automático, proponemos un enfoque basado en el aprenaprendizaje profundo para reducir la dimensionalidad de los datos de expresión, que emplea
aprendizaje supervisado y no supervisado para hacer uso de todas las muestras de tumores presentes en una base de datos para resolver una tarea de clasificación den cáncer concreta....