Alineamiento
Existen muchos programas para alinear secuencias, tanto online como en la compu; aquí veremos como hacerlo en el servidor BIOBACTER con comandos. Esto es especialmente útil cuando tratamos de alinear muchas secuencias y/o secuencias muy largas.
$ mafft --thread 16 --auto FILE.fasta > FILE.aln.fna
--thread Número de CPU a utilizar, esto depende de cuantos CPU tenga el servidor.
--auto Determina el mejor método de alineamiento.
FILE.fasta Archivo multifasta con las secuencias a alinear; puede tener cualquier nombre.
MAFFT genera un archivo con el alineamiento en formato fasta; este formato se puede usar para crear árboles filogenéticos directamente pero es conveniente primero eliminar las regiones poco informativas y con muchos gaps con el script GBlocks.
Clustal se puede llamar simplemente con clustalw para tener unos menus e ir paso a paso, o bien con línea de comandos:
$ clustalw -infile=file.fasta -outfile=file.aln
Clustal también tiene una nueva version llamada Clustal Omega (clustalo), mas útil para alineamiento de cientos o miles de secuencias.
$ clustalo -i file.fasta -o file.aln --threads 16
--thread Número de CPU a utilizar, esto depende de cuantos CPU tenga el servidor.
$ t_coffee file.fasta -special_mode dna -outfile=file_tc.aln
T-coffee genera un alineamineto (file_tc.aln) y un archivo html muy útil para ver como quedó el alineamiento a colores.