Pipeline viejo

Para el análisis de secuencias metagenómicas dirigidas a amplicones del 16S se puede seguir el siguiente pipeline algo anticuado pero aún vigente.

  1. Preparación de metadatos
  2. Limpieza de lecturas
  3. Descontaminación de lecturas
    1. Eliminación de quimeras
    2. Descontaminación
    3. Separación de dominios
    4. Eliminación de secuencias eucariontes del 16S y 18S
  4. Análisis de secuencias
    1. QIIME
    2. RDP
    3. mg_classifier
  5. Diversidad
  6. Visualización
  7. Análisis estadístico

Notas importantes.

Cuando se están procesando cientos de miles de secuencias, el proceso se hace demasiado lento para una computadora o laptop de escritorio, por lo que es conveniente realizar estas operaciones en un servidor bioinformático.

Secuencias a partir de Ion Torrent

En el servidor biobacter podemos correr la limpieza y descontaminación con un simple script (mg_cleaner.sh, para secuencias obtenidas con Ion Torrent PGM) y la clasificación con QIIME con otro (QIIME_analysis.sh). Como ambos pueden tardar horas, se pueden dejar corriendo si se incluye & al final de comando para llamar al script:

$ mg_cleaner &
$ qiime
$ validate_mapping_file.py -B -m map.txt
$ QIIME_analysis all_samples.fasta map.txt &

mg_cleaner.sh toma todos los archivos fastq que existan en el directorio desde el que se ejecuta.

El comando qiime (en minúsculas) inicia un shell para poder usar qiime. Una vez iniciado el shell, ya podemos correr los scripts de validación del map y de análisis.

QIIME_analysis.sh necesita el archivo generado por mg_cleaner llamado all_samples.fasta y un archivo con los datos de las muestras validado (map.txt, ver Preparación de metadatos).