Aplicación de técnicas de Deep Learning al Alineamiento Múltiple de Secuencias

dc.centroE.T.S.I. Informáticaes_ES
dc.contributor.advisorGarcía-Nieto, José Manuel
dc.contributor.advisorNebro-Urbaneja, Antonio Jesús
dc.contributor.authorPiriz Sapio, Fiorella
dc.date.accessioned2021-12-10T12:31:35Z
dc.date.available2021-12-10T12:31:35Z
dc.date.created2021
dc.date.issued2021
dc.departamentoLenguajes y Ciencias de la Computación
dc.description.abstractEn la última década, Deep Learning (DL) ha sido una de las técnicas más em pleadas en diversos campos de estudio, incluida la Bioinformática. Sin embargo, a día de hoy no existen demasiados estudios en los que se aplique DL en para el Alineamiento de Secuencias Múltiples (MSA), una herramienta esencial en el día a día de disciplinas como la Biología y la Bioinformática. En concreto, los problemas de MSA son muy relevantes en Bioinformática ya que permite des cubrir similitudes entre múltiples secuencias biológicas (ADN, ARN o proteína). Además, tiene muchas aplicaciones en la comparación de estructuras y el análisis funcional. Sin embargo, la alineación resultante puede diferir de usar una u otra aplicación, por lo que, el resultado puede no ser óptimo, lo cual es el objetivo de MSA. Por tanto, es una tarea difícil elegir qué alineación realizar dependiendo de la familia de proteínas. Por ello, en este trabajo de fin de grado proponemos una herramienta para comparar diferentes modelos de Machine Learning, como Decision Tree, Ran dom Forest o Gradient Boosting, con dos arquitecturas de redes neuronales con volucionales (CNN). El objetivo es demostrar que el aprendizaje profundo es un procedimiento eficaz para clasificar familias de proteínas en función del prome dio de identidad porcentual por pares de secuencias(PID).Estos modelos de toma de decisiones determinan cuál de las cuatro herramientas seleccionadas para la Alineación de Secuencias Múltiples (MSA): MAFFT, Muscle, ClustalW2 y T-coffee, proporcionará la alineación final más precisa. Finalmente, para representar el proyecto, hemos implementado una aplicación Web llamada MachineLAlign (código abierto disponible aquí) que permite obtener el MSA con cualquiera de los modelos entrenados y evaluados.es_ES
dc.identifier.urihttps://hdl.handle.net/10630/23382
dc.language.isospaes_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectBioinformáticaes_ES
dc.subjectAlineamiento de secuencias (Bioinformática)es_ES
dc.subjectAprendizaje automático (Inteligencia artificial)es_ES
dc.subjectAplicaciones (Software)es_ES
dc.subjectGrado en Ingeniería de la Salud - Trabajos Fin de Gradoes_ES
dc.subjectInformática - Trabajos Fin de Gradoes_ES
dc.subject.otherAlineamiento múltiple de secuenciases_ES
dc.subject.otherDeep learninges_ES
dc.subject.otherMachine learninges_ES
dc.subject.otherEvaluación de rendimientoes_ES
dc.titleAplicación de técnicas de Deep Learning al Alineamiento Múltiple de Secuenciases_ES
dc.title.alternativeDeep Learning and its applications in Multiple Sequence Alignmentes_ES
dc.typebachelor thesises_ES
dspace.entity.typePublication
relation.isAdvisorOfPublication04a9ec70-bfda-4089-b4d7-c24dd0870d17
relation.isAdvisorOfPublicationeddeb2e3-acaf-483e-bb13-cebb22c18413
relation.isAdvisorOfPublication.latestForDiscovery04a9ec70-bfda-4089-b4d7-c24dd0870d17

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Piriz Sapio Fiorella Memoria.pdf
Size:
1.06 MB
Format:
Adobe Portable Document Format
Description: