Las especies del género Pinus son de gran interés económico y ecológico en todo el mundo, y especialmente en el hemisferio norte. Sin embargo estas especies carecen de un genoma secuenciado debido a la complejidad y los grandes tamaños de sus genomas, repletos de repeticiones y elementos transponibles. Por estos motivos, la mejor aproximación para el estudio de estos organismos es el análisis de sus genes a través del transcriptoma.
El transcriptoma del pino, en especial de Pinus pinaster, se estudia en este trabajo mediante el análisis de la expresión de sus genes en diferentes condiciones y tejidos, a través de micromatrices de cDNA y de la secuenciación y caracterización de estos genes.
Para ello se desarrollan una serie de herramientas bioinformáticas útiles para el análisis de micromatrices de cDNA, y para el preprocesamiento y anotación de secuencias de tipo Sanger y de Next Generation Sequencing. También se propone un protocolo de preprocesamiento, ensamblaje y anotación de transcriptomas para especies no modelo que carecen de un genoma de referencia, en el que se aplican estas herramientas y se demuestran sus beneficios.
La información obtenida se ha integrado en bases de datos, para ponerla a disposición de la comunidad científica, y se propone un modelo de base de datos de rápido desarrollo para contener información de transcriptómica. En la última versión del transcriptoma de pino se han agrupado los genes con anotaciones y genes específicos de la especie, para obtener un transcriptoma fiable de unos 30.000 genes. La información del transcriptoma de pino se aplica en la anotación de micromatrices y el desarrollo de una micromatriz de más de 8000 puntos.