ANI
Average Nucleotide Identity (ANI)
Este análisis nos permite comparar la similitud de nucleótidos entre dos genomas bacterianos para determinar si pertenecen o no a la misma especie. Cepas de la misma especie deben tener una similitud superior al 95-96% con alguno o ambos métodos de comparación, MUMmer o blast (ANIm o ANIb, respectivamente). También el análisis de tetranucleóticos (TETRA) debe salir superior a 99% (Richter & Roselló-Mora 2009).
Existen dos variantes de este análisis:
Usando el genoma completo o parte del genoma (> 25%).
Usando sólo genes ortólogos.
ANI con genomas
Este análisis lo podemos hacer tanto en páginas online como en nuestra computadora o en un servidor.
La páginas online tiene como limitación el número de genomas que podemos comparar. ANI calculator solo permite compara dos genomas. Una mejor opción es JSpecies WS.
En nuestra compu podemos instalar JSpecies, al ser un programa en JAVA puede correr en cualquier tipo de sistema operativo, pero la interfaz en complicada si quiere uno comparar varios genomas.
En un servidor es mejor cuando se quieren comparar varios genomas mediante el script pyani.
Aquí describiremos el proceso para utilizar pyani en el servidor BIOBACTER.
Tener los genomas a analizar en formato fasta en un directorio, la extensión de los genomas debe ser .fasta
Ejecutar el script average_nucleotide_identity.py.
Genera varios archivos con resultados, pero los básicos son:
ANIb_percentage_identity.tab Este contiene los resultados en una tabla.
ANIb_percentage_identity.pdf Este es el heatmap en formato PDF.
Si los archivos no tienen la extensión adecuada, se puede cambiar ésta con el comando rename; por ejemplo, si tiene la extensión .fna_nt se debe usar:
$ rename "s/fna_nt/fasta/" *.fna_nt
Comando para calcular ANI:
$ conda activate pyani
(pyani)$ average_nucleotide_identity.py -i input_folder -o output_folder -m method -g --workers 12
-i el folder donde están los genomas y solo los genomas en formato fasta.
-o el folder que se creará con los resultados, puede ser cualquier nombre pero no debe ser creado previamente ya que el script lo creará (ver abajo -f).
-m el método de análisis: ANIm, ANIb o TETRA
comando opcionales
-g para crear un heatmap con los resultados.
--workers El número de CPUs a usar, 12 es bueno.
-f sobre escribe los archivos en un folder existente
ANI de genes ortólogos
Este análisis lo podemos realizar también online, en la compu o en el servidor.
Online en la página de JGS MiSI, pero solo para dos genomas.
En la compu con el programa JAVA OrthoANI, máximo 10 genomas.
En el servidor con el script gANI, pero sólo también dos genomas por vez.
gANI en el servidor BIOBACTER
Primero es necesario obtener los ORF (genes o CDS) de archivos fasta en nucleótidos. Esto se puede hacer con el script prodigalrunner.
$ prodigalrunner genome.fasta
2. Con los archivos generados anteriormente (.fna) correr el script gANI.
$ gANI -genome1fna FILE1.fna -genome2fna FILE2.fna -outfile ANI.txt
-genome1fna El archivo con los ORF del primer genoma en formato .fna
-genome2fna El archivo con los ORF del segundo genoma en formato .fna
-outfile El nombre de un archivo de texto donde escribirá los resultados.