Metagenómica 16S/18S
El análisis de ADN total extraído de una muestra se conoce como metagenómica. Existen dos tipos básicos: funcional y dirigida.
Para el análisis de secuencias metagenómicas dirigidas a amplicones del 16S o 18S rRNA se puede seguir el siguiente pipeline simple. Tenemos un pipeline aquí.
Metagenómica dirigida al 16S o 18S
Pipeline en el Lab de Genómica Microbiana del CIAD
Las secuencias generadas por Illumina (pair-end) se pueden procesar siguiendo el siguiente pipeline; en el esquema aparecen los script que se pueden usar para cada paso.
pair-end_cleaner busca los archivos fastq o fastq.gz en todos los subdirectorios (ya que Illumina por defecto hace una carpeta para cada muestra), los limpia, los ensambla y los convierte a fasta en un nuevo subdirectorio llamado assembled/. Mas información aquí.
chimera_detector busca y elimina secuencias quiméricas y genera secuencias limpias para ser analizadas. Mas información aquí.
mg_classifier asigna taxón a las secuencias limpias. Mas información aquí.
mg_reporter obtiene los reportes creados por los tres scripts anteriores y genera un reporte general de todo el pipeline.
Todos estos scripts están integrados en un pipeline que está disponible en Github con una explicación de cada uno, así como las bases de datos libres que se pueden usar. El pipeline también incluye un script para elaborar un reporte de los pasos realizados.
Descripción detallada paso a paso
Notas importantes.
Cuando se están procesando cientos de miles de secuencias, el proceso se hace demasiado lento para una computadora o laptop de escritorio, por lo que es conveniente realizar estas operaciones en un servidor bioinformático. Los scripts estarán disponibles en Github.
El análisis metagenómico funcional implica secuenciar todo el ADN de una muestra (previa fragmentación) y analizar para identificar genes presentes en la muestra y así tener una idea de las funciones que se están realizando en la muestra. El proceso se puede consultar aquí.