Alineamiento

Existen muchos programas para alinear secuencias, tanto online como en la compu; aquí veremos como hacerlo en el servidor BIOBACTER con comandos. Esto es especialmente útil cuando tratamos de alinear muchas secuencias y/o secuencias muy largas.

MAFFT

$ mafft --thread 16 --auto FILE.fasta > FILE.aln.fna

--thread Número de CPU a utilizar, esto depende de cuantos CPU tenga el servidor.

--auto Determina el mejor método de alineamiento.

FILE.fasta Archivo multifasta con las secuencias a alinear; puede tener cualquier nombre.

MAFFT genera un archivo con el alineamiento en formato fasta; este formato se puede usar para crear árboles filogenéticos directamente pero es conveniente primero eliminar las regiones poco informativas y con muchos gaps con el script GBlocks.

Clustal se puede llamar simplemente con clustalw para tener unos menus e ir paso a paso, o bien con línea de comandos:

$ clustalw -infile=file.fasta -outfile=file.aln

Clustal también tiene una nueva version llamada Clustal Omega (clustalo), mas útil para alineamiento de cientos o miles de secuencias.

$ clustalo -i file.fasta -o file.aln --threads 16

--thread Número de CPU a utilizar, esto depende de cuantos CPU tenga el servidor.

$ t_coffee file.fasta -special_mode dna -outfile=file_tc.aln

T-coffee genera un alineamineto (file_tc.aln) y un archivo html muy útil para ver como quedó el alineamiento a colores.