La metagenómica shotgun o funcional secuencia todo el ADN que existe en una muestra y puede ser usada para:
Determinar que organismos están presentes (clasificación taxonómica).
Determinar que genes están presentes (clasificación funcional).
Obtener genomas a partir de metagenomas (MAGs).
Todas las anteriores.
Debido a la gran cantidad de secuencias que normalmente se producen en metagenómica, es poco factible analizarlas en una laptop o computadora personal sino que debe utilizarse un servidor bioinformático como Biobacter.
Existen muchas formas de analizar metagenomas, el siguiente pipeline es el que frecuentemente seguimos en el Laboratorio de Genómica Microbiana.
La limpieza de las secuencia obtenidas es similar a la que se hace para genómica o metagenómica del 16S y depende de si las secuencia vienen una sola (Ion Torrent o Illumina) o en pares (pair end de Illumina).
Cómo lo más probable es que tengamos varias muestras entonces podemos correr el script para limpieza parallel_pair-end_cleaner que procesa todas las secuencias crudas como vienen del secuenciador en todos los subdirectorios y genera secuencias limpias en un nuevo directorio.
Una buena opción es ensamblar las secuencias para algunos análisis con megahit, como los de clasificación taxonómica (con Kraken 2, Kaiju) y funcional (con Superfocus). A la vez, podemos también convertirlos a formato fasta si así se requiere, pues para el ensamble sí se requiere la calidad de las secuencias, pero para la clasificación ya no tanto. Ver los pasos aquí.
Normalmente no se recomienda ensamblar las lecturas en contigs para determinar las funciones que están realizando los microorganismos en las muestras, salvo para algunas otras aplicaciones, como la generación de genomas de muestras metagenómicas. Este paso sí es necesario para el análisis con Anvi'o.
De las secuencias limpias pueden obtenerse el número relativo de taxa bacterianos presentes, ya que también se tienen lecturas del gen 16S ribosomal y claro, todos los demás genes.