Ensamble Híbrido

Comúnmente tenemos dos tipos de secuencias para un genoma, p. ej. secuencias cortas de alta calidad con Illumina y largas de no tan buena calidad obtenidas con Oxford Nanopore. Podemos con estas secuencias tener un ensamble híbrido que tendrá lo mejor de los dos mundos, alta calidad y contigs muy largos y así cerrar el genoma o casi.

Unicycler

Es conveniente limpiar primero las secuencias Oxford Nanopore largas para eliminar residuos de adaptadores:

$ conda activate python3.6

$ porechop -i input_reads.fastq.gz -o output_reads.fastq.gz --threads 8

Uno de los mejores ensambladores híbridos es Unicycler aunque no solo sirve para híbridos; además es muy fácil de usar:

$ conda activate python3.6

$ unicycler -1 short_reads_1.fastq -2 short_reads_2.fastq -l long_reads.fastq -o output_dir --threads 8 --spades_path /opt/SPAdes-3.13.0-Linux/bin/spades.py

Unicycler emplea a su vez ensambladores conocidos como SPAdes para secuencias cortas, Racon para largas y Pilon para pulida final del ensamble.