Domanda:
Gli effetti della conversione incompleta del bisolfito sull'efficienza della mappatura
DDRRpy
2017-05-24 11:41:10 UTC
view on stackexchange narkive permalink

Questa domanda è stata anche pubblicata su Biostars

Ho sequenziato numerosi pool multiplex di librerie BS amplicon-seq derivate da campioni umani su un MiSeq nelle ultime settimane. Ho utilizzato trim-galore e Bismark per l'allineamento e trovo che l'efficienza di mappatura sia davvero bassa per due pool (55% & 30% rispettivamente) che avevano entrambi una citosina per sequenza di basi di circa il 10-20% in tutto l'intero leggere nei file fastqc.

L'alto contenuto in C visibile nei file fastqc mi fa pensare che la scarsa efficienza di mappatura sia dovuta alla scarsa conversione del bisolfito, poiché ci si aspetterebbe che sia vicino allo zero se la conversione del bisolfito fosse ha avuto luogo.

Sono nuovo nel campo quindi qualsiasi aiuto sarebbe molto apprezzato.

Potrebbe essere utile familiarizzare con i passaggi alla base della mappatura delle letture convertite in bisolfito. In questo post su [biostars] (https://www.biostars.org/p/107871/) fornisco una rapida ripartizione dei passaggi coinvolti se vuoi dare un'occhiata (ma ovviamente c'è molto materiale disponibile su di essa).
Una risposta:
#1
+7
Devon Ryan
2017-05-24 11:46:37 UTC
view on stackexchange narkive permalink

L'efficienza di conversione del bisolfito non ha alcun effetto sul tasso di mappatura in corteccia e strumenti simili. Il motivo è che le letture sono completamente convertite in bisolfito in silico prima dell'allineamento per ridurre al minimo il bias di mappatura.

Suggerirei di giocare con le impostazioni assegnate a bowtie2, come l'utilizzo allineamento locale e modifica dell'opzione --score-min per consentire più discrepanze. In alternativa, potresti provare un allineatore diverso come bwameth, che eseguirà sempre l'allineamento locale.

Grazie. --la bandiera locale nei documenti bowtie2 sembra promettente, ci proverò quando entro in ufficio. Bismark analizzerà eventuali opzioni / flag bowtie2 in bowtie2 (chiedo come --local non è presente nei documenti bisamark ma solo nei documenti bowtie2)? Cosa posso concludere sull'elevata citosina per sequenza di basi nei file fastqc? Generalmente ho trovato che questo è allo 0% nelle analisi precedenti o al 10% alle estremità, a quel punto taglierei le estremità.
Non credo che bismark gestirà correttamente il flag `--local`, poiché si aspetta che le letture siano completamente allineate o vengano scartate, senza alcun soft clipping.
Se dopo aver eseguito bismark i grafici MBIAS non sembrano relativamente piatti, puoi passare un parametro di filtro a bismark_methylation_extractor, in modo che ad es. ignori gli ultimi 10 bp di ogni lettura.
@719016: Potresti aver ragione, sono passati alcuni anni da quando ho guardato il codice bismark, generalmente cerco di evitare di usarlo poiché è così incredibilmente lento e usato per dare scarsi risultati.
Come propone anche Devon Ryan, potresti provare bwameth, che è un semplice involucro attorno a bwa-mem e mantiene gli allineamenti morbidi se esistono. È quindi possibile applicare un altro script per contare i CpG dal bam, ad es. questo: https://github.com/dariober/bioinformatics-cafe/tree/master/bam2methylation
In genere raccomando [MethylDackel] (https://github.com/dpryan79/MethylDackel) per l'estrazione della metilazione e il controllo di qualità, ma sono di parte: P


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...