Ensamble genoma

En esta actividad ensamblaremos un genoma de la cepa K12 de E . coli. Esta bacteria la tenemos secuenciada por diversos métodos de secuenciación, Illumina, Ion Torrent y Oxford nanopore, así es que la podemos ensamblar con cada uno de ellos o incluso con varios (híbrido).

El genoma de esta cepa consta de un solo cromosoma circular de 4.64 Mpb y 4,288 CDS; fue secuenciado completo en 1997 (Blattner et al.).

El set de datos (ecoli.tar.gz) se puede bajar de:

Una vez bajado, se debe descomprimir: tar xzf ecoli.tar.gz

Una vez descomrpimidos tendremos los siguientes archivos:

├── genomas

│   ├── CP0000948.jpg

│   ├── CP0000948_mod.jpg

│   ├── CP000948_DH10B.gbk

│   ├── CP000948_DH10B_mod.gbk

│   ├── CP001368_0157.gbk

│   └── CP001637_DH1.gbk

└── Illumina

    ├── metadata.txt

    ├── SRR6436961_1.fastq

    └── SRR6436961_2.fastq

Los archivos Illumina (SRR6436961_) tienen 388,895 secuencias pareadas.