Ensamble genoma
En esta actividad ensamblaremos un genoma de la cepa K12 de E . coli. Esta bacteria la tenemos secuenciada por diversos métodos de secuenciación, Illumina, Ion Torrent y Oxford nanopore, así es que la podemos ensamblar con cada uno de ellos o incluso con varios (híbrido).
Nanopore
El genoma de esta cepa consta de un solo cromosoma circular de 4.64 Mpb y 4,288 CDS; fue secuenciado completo en 1997 (Blattner et al.).
El set de datos (ecoli.tar.gz) se puede bajar de:
Servidor biobacter en la ruta: /raid1/datasets/ecoli/ecoli.tar.gz
Una vez bajado, se debe descomprimir: tar xzf ecoli.tar.gz
Una vez descomrpimidos tendremos los siguientes archivos:
├── genomas
│ ├── CP0000948.jpg
│ ├── CP0000948_mod.jpg
│ ├── CP000948_DH10B.gbk
│ ├── CP000948_DH10B_mod.gbk
│ ├── CP001368_0157.gbk
│ └── CP001637_DH1.gbk
└── Illumina
├── metadata.txt
├── SRR6436961_1.fastq
└── SRR6436961_2.fastq
Los archivos Illumina (SRR6436961_) tienen 388,895 secuencias pareadas.