Diseño de un flujo de trabajo para el análisis de datos procedentes de secuenciación masiva

Segura Ortiz, Adrián

Diseño de un flujo de trabajo para el análisis de datos procedentes de secuenciación masiva

Files

Segura Ortiz Adrián Memoria.pdf (5.61 MB)

Identifiers

URI: https://hdl.handle.net/10630/23386

Publication date

2021

Authors

Segura Ortiz, Adrián

Advisors

Jerez-Aragonés, José Manuel

Álvarez-Pérez, Martína

Metrics

Share

Export

Center

E.T.S.I. Informática

Department/Institute

Lenguajes y Ciencias de la Computación

Keywords

Biología molecular
Análisis de datos
Bioinformática
Grado en Ingeniería de la Salud - Trabajos Fin de Grado
Informática - Trabajos Fin de Grado

Abstract

Actualmente, la secuenciación masiva ha sido integrada en numerosos laboratorios clínicos a causa de ser la herramienta más potente para llevar a cabo la identificación de alteraciones moleculares sobre muestras de pacientes. Con ello, ha surgido la clara necesidad de diseñar softwares capaces de procesar la inmensa cantidad de datos producidos por los diferentes equipos de secuenciación. El flujo de trabajo descrito en este proyecto se ha destinado a su ejecución en la supercomputadora Picasso [1] para el análisis de datos procedentes del La boratorio de Biología Molecular del Cáncer [2], por lo que su implementación se adapta a la metodología realizada en dicho centro, esto es, secuenciación dirigida con paneles de amplicones mediante tecnología Ion Torrent de lectura única. El script implementado principalmente en Bash, abarca las usuales etapas de procesado de lecturas, alineamiento, llamada e identificación de variantes, así como la detección de alteraciones en el número de copias y reordenamientos genéticos. Tras su ejecución, el usuario obtiene diversas tablas en formato XLSX con información acerca de las variantes detectadas para cada una de las muestras. Con ello, se consigue automatizar el procesamiento de los datos brutos del secuenciador y se proporciona al usuario una fuente de datos útil para posteriores tareas de ámbito clínico como la asignación de fármacos diana.

Collections

Trabajos Fin de Grado

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional

Full item page

Diseño de un flujo de trabajo para el análisis de datos procedentes de secuenciación masiva

Files

Identifiers

Publication date

Reading date

Authors

Collaborators

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Share

Export

Research Projects

Organizational Units

Journal Issue

Center

Department/Institute

Keywords

Abstract

Description

Bibliographic citation

Collections

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license