ANI

Average Nucleotide Identity (ANI)

Este análisis nos permite comparar la similitud de nucleótidos entre dos genomas bacterianos para determinar si pertenecen o no a la misma especie. Cepas de la misma especie deben tener una similitud superior al 95-96% con alguno o ambos métodos de comparación, MUMmer o blast (ANIm o ANIb, respectivamente). También el análisis de tetranucleóticos (TETRA) debe salir superior a 99% (Richter & Roselló-Mora 2009).

Existen dos variantes de este análisis:

  1. Usando el genoma completo o parte del genoma (> 25%).

  2. Usando sólo genes ortólogos.

ANI con genomas

Este análisis lo podemos hacer tanto en páginas online como en nuestra computadora o en un servidor.

  • La páginas online tiene como limitación el número de genomas que podemos comparar. ANI calculator solo permite compara dos genomas. Una mejor opción es JSpecies WS.

  • En nuestra compu podemos instalar JSpecies, al ser un programa en JAVA puede correr en cualquier tipo de sistema operativo, pero la interfaz en complicada si quiere uno comparar varios genomas.

  • En un servidor es mejor cuando se quieren comparar varios genomas mediante el script pyani.

Aquí describiremos el proceso para utilizar pyani en el servidor BIOBACTER.

  1. Tener los genomas a analizar en formato fasta en un directorio, la extensión de los genomas debe ser .fasta

  2. Ejecutar el script average_nucleotide_identity.py.

  3. Genera varios archivos con resultados, pero los básicos son:

    1. ANIb_percentage_identity.tab Este contiene los resultados en una tabla.

    2. ANIb_percentage_identity.pdf Este es el heatmap en formato PDF.

Si los archivos no tienen la extensión adecuada, se puede cambiar ésta con el comando rename; por ejemplo, si tiene la extensión .fna_nt se debe usar:

$ rename "s/fna_nt/fasta/" *.fna_nt

Comando para calcular ANI:

$ conda activate pyani

(pyani)$ average_nucleotide_identity.py -i input_folder -o output_folder -m method -g --workers 12

-i el folder donde están los genomas y solo los genomas en formato fasta.

-o el folder que se creará con los resultados, puede ser cualquier nombre pero no debe ser creado previamente ya que el script lo creará (ver abajo -f).

-m el método de análisis: ANIm, ANIb o TETRA

comando opcionales

-g para crear un heatmap con los resultados.

--workers El número de CPUs a usar, 12 es bueno.

-f sobre escribe los archivos en un folder existente

ANI de genes ortólogos

Este análisis lo podemos realizar también online, en la compu o en el servidor.

  • Online en la página de JGS MiSI, pero solo para dos genomas.

  • En la compu con el programa JAVA OrthoANI, máximo 10 genomas.

  • En el servidor con el script gANI, pero sólo también dos genomas por vez.

gANI en el servidor BIOBACTER

  1. Primero es necesario obtener los ORF (genes o CDS) de archivos fasta en nucleótidos. Esto se puede hacer con el script prodigalrunner.

$ prodigalrunner genome.fasta

2. Con los archivos generados anteriormente (.fna) correr el script gANI.

$ gANI -genome1fna FILE1.fna -genome2fna FILE2.fna -outfile ANI.txt

-genome1fna El archivo con los ORF del primer genoma en formato .fna

-genome2fna El archivo con los ORF del segundo genoma en formato .fna

-outfile El nombre de un archivo de texto donde escribirá los resultados.