El incremento en la eficiencia de las técnicas de alto rendimiento y el avance de los métodos de integración y análisis de información, han permitido estudiar las enfermedades integrando varios niveles de complejidad. El estudio de toda esta información ha proporcionado otra visión de enfermedades complejas y multifactoriales como el cáncer, la obesidad o la diabetes. El caso de las enfermedades raras es especialmente complejo debido a la heterogeneidad de las etiologías y la baja disponibilidad de muestras de pacientes y familias para el análisis molecular y fenotípico de estas patologías. La integración de datos masivos generados a partir de técnicas experimentales de alto rendimiento facilita el estudio de las enfermedades genéticas o de baja prevalencia. Trabajos como el desarrollado por Goh et al., 2007 resalta la importancia de estudiar la complejidad de las relaciones entre los genes asociados a enfermedades. Este estudio muestra que las enfermedades generalmente manifiestan diversos síntomas y que distintas patologías se pueden asociar a fenotipos patológicos similares; asociados a alteraciones en procesos biológicos relacionados funcionalmente. Si bien uno de los grandes problemas de la integración de información (pato)fenotípica radica en lo sujeta que está al lenguaje natural, herramientas como HPO facilitan esta integración.
Para profundizar en las relaciones fenotípicas entre enfermedades, en esta tesis se trabaja en la hipótesis de que: El estudio de las enfermedades complejas a partir del perfil fenotípico que las describe y la integración de esta información en su contexto biomolecular permite identificar los mecanismos moleculares afectados en múltiples procesos patológicos. Para ello en primer lugar se analizaron las relaciones fenotípicas entre genes.