Domanda:
È possibile utilizzare un file .gtf GRCh38 personalizzato con una qualsiasi delle patch rilasciate da GRCh38?
TasosGlrs
2017-06-09 14:15:27 UTC
view on stackexchange narkive permalink

Ho un file GRCh38.79 .gtf personalizzato (modificato per non avere geni MT) e ho bisogno di creare un genoma di riferimento da esso (per la pipeline 10xGenomics CellRanger). Sospetto che la parte .79 sia il numero di Ensembl, che secondo questo elenco di archivi di ensembl è abbinato alla patch GRCh38.p2.

Dovrei usare il file fasta di questa patch, o andrebbe bene usare una qualsiasi delle patch GRCh38?

Hai preso in considerazione l'invio di e-mail a 10xGenomics e la domanda? Stai già pagando loro i soldi per i loro prodotti, quindi risponderanno.
So come creare il genoma di riferimento usando cellranger, nel qual caso potrebbero aiutare. La mia domanda è più su come funziona il controllo delle versioni GRCh ##, per il quale penso che qui sia un posto migliore e decisamente più veloce per chiedere piuttosto che 10xGenomics.
Le diverse versioni di Ensembl sono associate a patch del genoma con diversi contigui di patch, quindi diventa una questione se il loro software sia in grado di gestire i contigui mancanti.
Va bene, giusto! Questa è una domanda che dovrei porre loro. Grazie @DevonRyan. Tuttavia, se la loro risposta è positiva, sarebbe ancora molto meglio usare entrambe le parti della stessa versione, o non fa molta differenza?
Se non danneggia il loro software, allora non dovrebbe importare in alcun modo :) In realtà, è banale rimuovere un intero cromosoma da un GTF, quindi usa GTF / fasta dalla versione più recente di Ensembl e otterrai risultati leggermente più affidabili.
A proposito, sentiti incoraggiato a pubblicare la loro risposta, da allora verrà indicizzata su Google.
Una risposta:
tweirick
2017-06-11 04:09:04 UTC
view on stackexchange narkive permalink

Puoi vedere l'assemblaggio esatto cercando nel file README nella pagina di download del genoma di Ensembl. ftp://ftp.ensembl.org/pub/release-89/fasta/homo_sapiens/dna/README

Come puoi vedere l'assembly corrente è GCA_000001405.25. Ensembl 79 utilizza la versione GCA_000001405.17. Puoi aspettarti alcune differenze tra le versioni dell'assieme.

Se dai un'occhiata a https://www.ncbi.nlm.nih.gov/assembly?term=GRCh38&cmd=DetailsSearch

Puoi vedere che 20.466.394 bp sono stati aggiunti da 17 -> 25. Questa è solo una variazione dello 0,6%, quindi immagino che non ci sia molta differenza tra queste versioni. Tuttavia, se fossi in te, userei la versione corrispondente di Ensembl. Ancora meglio sarebbe usare l'ultima versione di Ensembl, poiché non solo la sequenza primaria dei genomi ma anche le posizioni dei geni possono cambiare tra le versioni ( https://doi.org/10.1093/bib/bbw017) .



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...