Domanda:
Come posso utilizzare le letture Nanopore per chiudere le lacune o risolvere le ripetizioni in un assembly di lettura breve?
Tom Harrop
2017-07-26 14:40:19 UTC
view on stackexchange narkive permalink

Le letture MinION a bassa copertura dovrebbero essere utili per colmare le lacune e risolvere le ripetizioni lasciate dagli assemblatori di letture brevi. Tuttavia, non ho avuto alcun successo con il software che conosco. Sono a conoscenza dei seguenti pacchetti, sia per lo scaffolding che per colmare le lacune in assembly di lettura breve utilizzando letture lunghe:

Ho provato npScarf e LINKS e sono stati eseguiti correttamente ma non hanno risolto le lacune nel mio assembly. Non sono riuscito a far funzionare PBJelly e OPERA-LG con le versioni correnti di BLASR e samtools e entrambi i pacchetti sembrano non essere mantenuti. Non ho provato SSPACE-longread perché non è open source.

Quale software posso utilizzare per colmare le lacune e risolvere le ripetizioni in un assembly di lettura breve con copertura dati sui nanopori?


Maggiori informazioni

Sto finendo un genoma mitocondriale. Ho un assembly di lettura breve da 17 kb con uno spazio vuoto. Questo è stato effettuato da 2x150b di letture paired-end da una libreria TruSeq PCR-free con una dimensione dell'inserto di 400 b. I dati molecolari suggeriscono che il genoma potrebbe essere di circa 32 kb.

Dopo aver mappato le letture brevi rispetto all'assemblaggio di letture brevi, Pilon ha identificato una ripetizione tandem di 156 bp in una regione ricca di AT, ma non sono riuscito a colmare il divario.

Ho 1.4 Gb di letture rapide MinION con un L50 di 8808 b. Ho mappato queste letture rispetto all'assembly di lettura breve e posso vedere letture che coprono il divario. Mi sembra di avere le informazioni necessarie per colmare il divario, ma non so come farlo.

L'organismo ha un genoma nucleare> 600 Mb, quindi la copertura di letture lunghe è bassa. Nonostante ciò, ho provato un assemblaggio de novo Canu delle letture Nanopore e ho estratto un contig da 39 kb contenente geni mitocondriali. La maggior parte dei geni su questo contig sono duplicati e frammentati e Pilon non è stato in grado di migliorarli.

Grazie per la lettura!

Fornisci ulteriori dettagli (letture singole / pe, lunghezza di lettura, distribuzione della dimensione dell'inserto se pe, tecnologia di sequenziamento) sul tuo assembly di lettura breve. Se hai letture Illumina paired-end sovrapposte, suggerisco di unirle e provare a migliorare l'assemblaggio in seguito. Il tuo assembly di lettura breve è circa la metà delle dimensioni che ti aspetti dai dati molecolari (che tipo di dati). Quindi forse c'è una duplicazione più ampia. Non ho familiarità con i genomi dei mitomi e non so se esistono duplicazioni in generale nei genomi dei mitomi. Nemmeno io conosco l'organismo che cerchi di assemblare. Hai visto qualche regione con
Grazie per il commento. Ho aggiunto i dettagli della libreria SR. Esistono diverse possibilità per la discrepanza delle dimensioni. Potrebbe riguardare una duplicazione, un inserimento nucleare di mtDNA, una regione di ripetizione, ecc. È anche possibile che i dati molecolari (mappatura RE e Southern blot) siano errati. Sarebbe utile colmare il divario!
Una risposta:
mgalardini
2017-07-26 15:25:30 UTC
view on stackexchange narkive permalink

Potresti voler esaminare Unicycler (il manoscritto con ulteriori informazioni può essere trovato qui); anche se dovrebbe essere usato solo con genomi batterici, potrebbe funzionare bene con un piccolo genoma come quello di un mitocondrio.

enter image description here

Fai attenzione che se ti capita di avere letture molto lunghe, potresti finire con un assembly con più copie del genoma circolare: potresti voler esaminare circlator.

I mitocondri ** sono ** batteri. Tuttavia, la loro lunga coevoluzione come endosimbioti potrebbe aver avuto un'influenza su alcune delle loro caratteristiche genomiche.
Esattamente; infatti, non sono a conoscenza di batteri con un genoma di ~ 32kb :)
Questo ha funzionato bene per me. Ho ottenuto una singola connessione circolare da 21 kb con tutti i geni mt previsti. Grazie per avermi avvisato di questo software!


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...