Pipeline viejo
Para el análisis de secuencias metagenómicas dirigidas a amplicones del 16S se puede seguir el siguiente pipeline algo anticuado pero aún vigente.
- Preparación de metadatos
- Limpieza de lecturas
- Descontaminación de lecturas
- Análisis de secuencias
- Diversidad
- Visualización
- Análisis estadístico
Notas importantes.
Cuando se están procesando cientos de miles de secuencias, el proceso se hace demasiado lento para una computadora o laptop de escritorio, por lo que es conveniente realizar estas operaciones en un servidor bioinformático.
Secuencias a partir de Ion Torrent
En el servidor biobacter podemos correr la limpieza y descontaminación con un simple script (mg_cleaner.sh, para secuencias obtenidas con Ion Torrent PGM) y la clasificación con QIIME con otro (QIIME_analysis.sh). Como ambos pueden tardar horas, se pueden dejar corriendo si se incluye & al final de comando para llamar al script:
$ mg_cleaner &
$ qiime
$ validate_mapping_file.py -B -m map.txt
$ QIIME_analysis all_samples.fasta map.txt &
mg_cleaner.sh toma todos los archivos fastq que existan en el directorio desde el que se ejecuta.
El comando qiime (en minúsculas) inicia un shell para poder usar qiime. Una vez iniciado el shell, ya podemos correr los scripts de validación del map y de análisis.
QIIME_analysis.sh necesita el archivo generado por mg_cleaner llamado all_samples.fasta y un archivo con los datos de las muestras validado (map.txt, ver Preparación de metadatos).