El cáncer es la segunda causa de muerte a nivel mundial actualmente y se prevé que los
casos diagnosticados no dejarán de aumentar. El cáncer de mama es el que con más frecuencia
se diagnostica en mujeres, y, tratado de forma correcta, tiene uno de los índices de
supervivencia más altos. La efectividad y consecuente supervivencia del paciente depende
de cada caso particular, por lo que es de vital importancia poder conocer el modelado de
su supervivencia de forma previa.
La inteligencia artficial es un campo que no deja de crecer, y con él, su aplicación en el
ámbito clínico (habiendo superado a los humanos en muchas tareas médicas basadas en
evidencia). En análisis de supervivencia, emergió el primer estimador de riesgo estable en
1989 (Gail Model ) basado en métodos estadísticos. Desde entonces, son abundantes las
versiones del mismo que se han realizado y escaso el uso del aprendizaje automático en
estas. Los métodos estadísticos hacen muy sencillo evaluar las relaciones no lineales entre
variables y el impacto que estas causan sobre la variable a predecir (evento). Sin embargo,
por no ser más que ecuaciones matemáticas, presentan carencias que limitan la calidad
de sus resultados.
En este proyecto proponemos algoritmos de aprendizaje automático supervisado como
alternativa a los métodos estadísticos para predecir y modelar la supervivencia, habiendo
probado su mejor funcionamiento. Sabiendo que la mayor dficultad con la que se lidia en
datos clínicos es su cantidad y calidad, además de replicarlos, hemos realizado un extenso
paso previo para garantizar la calidad de los mismos. Sin ignorar la facilidad en análisis
multivariante que el método estadístico de Cox ofrece, lo hemos usado junto con otros
métodos y tests estadísticos para encontrar el mejor conjunto de datos posible con el
que entrenar nuestro modelo.