Aplicación de técnicas de Deep Learning al Alineamiento Múltiple de Secuencias
| dc.centro | E.T.S.I. Informática | es_ES |
| dc.contributor.advisor | García-Nieto, José Manuel | |
| dc.contributor.advisor | Nebro-Urbaneja, Antonio Jesús | |
| dc.contributor.author | Piriz Sapio, Fiorella | |
| dc.date.accessioned | 2021-12-10T12:31:35Z | |
| dc.date.available | 2021-12-10T12:31:35Z | |
| dc.date.created | 2021 | |
| dc.date.issued | 2021 | |
| dc.departamento | Lenguajes y Ciencias de la Computación | |
| dc.description.abstract | En la última década, Deep Learning (DL) ha sido una de las técnicas más em pleadas en diversos campos de estudio, incluida la Bioinformática. Sin embargo, a día de hoy no existen demasiados estudios en los que se aplique DL en para el Alineamiento de Secuencias Múltiples (MSA), una herramienta esencial en el día a día de disciplinas como la Biología y la Bioinformática. En concreto, los problemas de MSA son muy relevantes en Bioinformática ya que permite des cubrir similitudes entre múltiples secuencias biológicas (ADN, ARN o proteína). Además, tiene muchas aplicaciones en la comparación de estructuras y el análisis funcional. Sin embargo, la alineación resultante puede diferir de usar una u otra aplicación, por lo que, el resultado puede no ser óptimo, lo cual es el objetivo de MSA. Por tanto, es una tarea difícil elegir qué alineación realizar dependiendo de la familia de proteínas. Por ello, en este trabajo de fin de grado proponemos una herramienta para comparar diferentes modelos de Machine Learning, como Decision Tree, Ran dom Forest o Gradient Boosting, con dos arquitecturas de redes neuronales con volucionales (CNN). El objetivo es demostrar que el aprendizaje profundo es un procedimiento eficaz para clasificar familias de proteínas en función del prome dio de identidad porcentual por pares de secuencias(PID).Estos modelos de toma de decisiones determinan cuál de las cuatro herramientas seleccionadas para la Alineación de Secuencias Múltiples (MSA): MAFFT, Muscle, ClustalW2 y T-coffee, proporcionará la alineación final más precisa. Finalmente, para representar el proyecto, hemos implementado una aplicación Web llamada MachineLAlign (código abierto disponible aquí) que permite obtener el MSA con cualquiera de los modelos entrenados y evaluados. | es_ES |
| dc.identifier.uri | https://hdl.handle.net/10630/23382 | |
| dc.language.iso | spa | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
| dc.rights.accessRights | open access | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
| dc.subject | Bioinformática | es_ES |
| dc.subject | Alineamiento de secuencias (Bioinformática) | es_ES |
| dc.subject | Aprendizaje automático (Inteligencia artificial) | es_ES |
| dc.subject | Aplicaciones (Software) | es_ES |
| dc.subject | Grado en Ingeniería de la Salud - Trabajos Fin de Grado | es_ES |
| dc.subject | Informática - Trabajos Fin de Grado | es_ES |
| dc.subject.other | Alineamiento múltiple de secuencias | es_ES |
| dc.subject.other | Deep learning | es_ES |
| dc.subject.other | Machine learning | es_ES |
| dc.subject.other | Evaluación de rendimiento | es_ES |
| dc.title | Aplicación de técnicas de Deep Learning al Alineamiento Múltiple de Secuencias | es_ES |
| dc.title.alternative | Deep Learning and its applications in Multiple Sequence Alignment | es_ES |
| dc.type | bachelor thesis | es_ES |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 04a9ec70-bfda-4089-b4d7-c24dd0870d17 | |
| relation.isAdvisorOfPublication | eddeb2e3-acaf-483e-bb13-cebb22c18413 | |
| relation.isAdvisorOfPublication.latestForDiscovery | 04a9ec70-bfda-4089-b4d7-c24dd0870d17 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Piriz Sapio Fiorella Memoria.pdf
- Size:
- 1.06 MB
- Format:
- Adobe Portable Document Format
- Description:

