Paso a paso

Descripción detallada paso a paso del pipeline a seguir para analizar secuencias metagenómicas de amplicones 16S o 18S.

  1. Si las secuencias provienen de varias secuenciaciones independientes, es necesario juntar todos los archivos en un mismo directorio, que llamaremos seqs
  2. Checar que todas los archivos tengan la estructura especificada aquí.
  3. Correr el script para limpieza pair-end_cleaner dentro del directorio en donde están los directorios con las secuencias (seqs). pair-end_cleaner crea un nuevo directorio con los resultados llamado assembled_ fecha.
  4. Subir al nivel superior y mover assembled_fecha a esta posición; esto es solo con el fin de mantener un orden en los subdirectorios.
  5. Entrar al directorio assembled_fecha y ejecutar la detección de quimeras con chimera_detector; este script también crea un nuevo subdirectorio llamado chimera_detector_fecha con las secuencias ya libres de quimeras.
  6. Volver a subir de nivel y mover chimera_detector_fecha aquí.
  7. Entrar a chimera_detector_fecha y ejecutar mg_classifier; de la misma forma crea un subdirectorio con resultados.
  8. Mover el nuevo directorio un nivel arriba.
  9. Ir a la raíz y correr mg_reporter para que compile todos los resultados de los tres scripts.
  10. También se pueden generar gráficas Krona a partir de los datos de clasificación obtenidos.

Estos son los comandos para hacer esto, escribir en la terminal solo lo que está entre $ y #. Estas instrucciones son para el servidor Biobacter.

XX significa la fecha y hora que ponen los scripts al momento de correrlos, por lo que este nombre de la carpeta cambia.

$ mkdir seqs    # crea el directorio seqs
$ cp * seqs    # copia todas las carpetas con las secuencias a seqs, checar si las carpetas están en este punto
$ cd seqs    # entra al directorio seqs
$ pair-end_cleaner    # ejecuta el script y crea una nueva carpeta llamada assembled_XX
$ cd ..    # sube un nivel
$ cp seqs/assembled_XX .    # copia la carpeta assembles_XX a donde esta uno (notar el punto al final)
$ cd assembled_XX    # entra a la carpeta assembles_XX
$ chimera_detector *.fasta
$ cd ..
$ cp assembled_XX/chimera_detector_XX .    # copia la carpeta chimera_detector_XX que está dentro de la carpeta assembled_XX
$ cd  chimera_detector_XX
$ mg_classifier *.fasta
$ cd ..
$ cp chimera_detector_XX/EzBioCloud_classified_XX .
$ cd ..
$ mg_reporter

$ cd EzBioCloud_classified_XX

$ OTUsamples2korna samples-tax.tsv # genera graficas de Krona con el archivo samples-tax.tsv