Microbioma

El análisis del microbioma intestinal de humanos puede hacerse de una manera rápida usando unos scripts más enfocados a este tipo de estudios. Básicamente tenemos que limpiar las secuencias como ya se ha explicado, clasificarlas con la base de datos SILVA y genera un reporte enfocado a los phyla, grupos importantes de bacterias y relaciones entre algunos de estos grupos.

Todo esto lo podemos hacer en Biobacter:

  1. Limpieza con mg_cleaner.sh
  2. Clasificación con SILVA_classifier.sh (un archivo) o
  3. Generar un reporte con gut_report.sh o compile_gut_data.sh

Limpieza

Podemos usar el script mg_cleaner.sh

$mg_cleaner &

Es necesario tener todos los archivos fastq en un directorio, los archivos ya tiene que tener un nombre sencillo (ver Limpieza). Debido a que este script puede tardar bastante (horas), al final del comando se puede poner un & para que el script corra a pesar de que se cierre la terminal; de esta manera se puede dejar trabajando el servidor y regresar después a ver si ya terminó.

Clasificación

El script SILVA_classifier.sh utiliza un archivo de secuencias multifasta limpias (generado con mg_cleaner), clasifica todas las secuencias en este archivo con vsearch usando la base de datos SILVA ver. 128 y genera varios archivos en un nuevo directorio además de un archivo tipo excel con la clasificación de cada tipo de OTU encontrada y el número de secuencias para cada OTU.

$ SILVA_classifier file.fasta

En caso de tener varios archivo a clasificar, podemos correr el script en todos ellos automáticamente siempre y cuando en el directorio desde el que ejecutemos el script estén archivos con terminación .fasta:

$ classify_ SILVA_all

Esto generará varios archivos para cada muestra y un resumen de todas en dos formatos.

Reporte

Este script genera un reporte enfocado a los grupos importantes en el microbioma intestinal humano, usando el archivo xls generado con el script SILVA_classifier. El reporte también es un archivo tipo excel llamado gut_report.csv. Además genera un gráfico tipo Krona con las OTUs encontradas.

$ gut_report file.xls

Compilación de datos

Claro que si analizamos muchas muestras, compilar todos los datos en un solo archivo será un proceso tedioso. Para facilitar esta compilación, tenemos un script que toma todos los archivos xls generados durante la clasificación y los compila en un solo archivo llamado gut_report.csv.

$ compile_gut_data

Este script debe ejecutarse en la carpeta donde estén todos los archivos .xls a compilar.

Ejemplo

Un ejemplo del reporte generado con gut_report es:

REPORTE

Análisis de la microbiota encontrada en la muestra.
Número de OTUs encontradas: 446
Phylum Secuencias
Firmicutes    843
Bacteroidetes    294
Proteobacteria    39
Verrucomicrobia    18
Actinobacteria    18
Tenericutes    11
Fusobacteria    1
Principales grupos de bacterias
ACTINOBACTERIA
    Bifidobacterium 4
BACTEROIDETES
    Alistipes 76
    Bacteroides 169
    Prevotella 1
FIRMICUTES
    Blautia 51
    Eubacterium 92
    Faecalibacterium 87
    Lachnospiraceae 218
    Roseburia 21
    Ruminococcus 50
VERRUCOMICROBIA
    Akkermansia 18
Relaciones:
Firmicutes/Bacteroidetes ratio: 2.867
Prevotella/Bacteroides ratio: .005