Ensamble Híbrido
Comúnmente tenemos dos tipos de secuencias para un genoma, p. ej. secuencias cortas de alta calidad con Illumina y largas de no tan buena calidad obtenidas con Oxford Nanopore. Podemos con estas secuencias tener un ensamble híbrido que tendrá lo mejor de los dos mundos, alta calidad y contigs muy largos y así cerrar el genoma o casi.
Unicycler
Es conveniente limpiar primero las secuencias Oxford Nanopore largas para eliminar residuos de adaptadores:
$ conda activate python3.6
$ porechop -i input_reads.fastq.gz -o output_reads.fastq.gz --threads 8
Uno de los mejores ensambladores híbridos es Unicycler aunque no solo sirve para híbridos; además es muy fácil de usar:
$ conda activate python3.6
$ unicycler -1 short_reads_1.fastq -2 short_reads_2.fastq -l long_reads.fastq -o output_dir --threads 8 --spades_path /opt/SPAdes-3.13.0-Linux/bin/spades.py
Unicycler emplea a su vez ensambladores conocidos como SPAdes para secuencias cortas, Racon para largas y Pilon para pulida final del ensamble.