Domanda:
Come convertire il file .vcf (imputato) con formato GT: GP in GT: DS?
Nilufer
2017-06-29 20:45:09 UTC
view on stackexchange narkive permalink

Ho i dati genotipizzati dall'output di impute2 in formato .gen (imputato a 1000G P3). Il file ha probabilità posteriori del genotipo (GP: 3 valori per variante). Ho convertito .gen in .vcf usando qctools e il file .vcf ha il formato GT: GP. Devo convertire il file .vcf con il formato GT: GP in GT: DS. I dosaggi del genotipo sono consigliati per l'uso nell'analisi qtltools / fastqtl. Tuttavia, non riesco a trovare uno strumento che mantenga il formato .vcf e converta GP in DS. Qualsiasi aiuto molto apprezzato!

Tre risposte:
Tim
2017-06-29 21:57:57 UTC
view on stackexchange narkive permalink

Puoi farlo in Hail.

Ecco il codice approssimativo per farlo (versioni 0.1).

Configurazione:

  from hail import * hc = HailContext ()  

Importa il file .gen. Anche VCF funziona:

  dataset = hc.import_gen ('src / test / resources / example.gen', 'src / test / resources / example.sample')  

Rimappa lo schema genotipo ed esporta in VCF:

  dataset.annotate_genotypes_expr ('g = {GT: g.call (), DS: g.dosage ()}') \ .export_vcf ('/ tmp / out.vcf.bgz')  

Dai un'occhiata alla pagina iniziale se vuoi provarla!

Dovrei notare che potresti essere in grado di fare analisi QTL in Hail, a seconda del metodo che vuoi usare. Vedi post del blog qui.

Hannah
2017-07-25 00:52:44 UTC
view on stackexchange narkive permalink

Hm, non sapevo che il plugin esistesse, quindi ho scritto il mio script per convertire GP in un dosaggio di allele minore su GitHub. Forse qualcun altro lo troverà utile :) https://github.com/7methylg/VCF-GP-to-DS

winni2k
2017-06-30 17:44:22 UTC
view on stackexchange narkive permalink

C'è il plugin di dosaggio per bcftools, ma restituisce solo valori separati da tabulazioni. Non sarebbe troppo difficile estendere il plug-in per generare invece un VCF con il tag DS, ma non è stato ancora fatto. C'è una buona probabilità che gli sviluppatori di bcftools rispondano a una richiesta di funzionalità...

In ogni caso, questo codice:

  curl https: //raw.githubusercontent.com/samtools/bcftools/develop/test/convert.vcf > convert.vcfbcftools + dosaggio convert.vcf > output.tsvhead -2 output.tsv 

ha il output:

  # [1] CHROM [2] POS [3] REF [4] ALT [5] NA00001 [6] NA00002 [7] NA00003 [8] NA00004 [9] NA00005 [ 10] NA00006 [11] NA00007 [12] NA00008 [13] NA00009 [14] NA00010X 2698560 GA 0,1 0,0 0,1 0,2 0,3 0,2 0,2 ​​0,2 ​​0,2 ​​0,1  

Questo utilizza bcftools versione 1.3.1 .

Ecco un estratto dal manuale di bcftools per il plugin di dosaggio:

dosaggio

print genotype dosaggio. Per impostazione predefinita, il plugin cerca PL, GL e GT, in quest'ordine.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...