Domanda:
Basato sull'allineamento o senza riferimento (analisi del trascrittoma)?
SmallChess
2017-05-17 10:19:49 UTC
view on stackexchange narkive permalink

Voglio concentrarmi sull'analisi del trascrittoma. Sappiamo che è possibile analizzare l'esperimento RNA-Seq in base all'allineamento o k-mers.

Possibile flusso di lavoro di allineamento:

  • Allinea le letture della sequenza con TopHat2
  • Quantificare l'espressione genica con Gemelli

Possibile flusso di lavoro senza riferimenti:

  • Quantificare la sequenza legge con Kallisto indice senza riferimenti

Entrambe le strategie generano una tabella di espressione genica.

D: Cosa sono pro e contro per ogni approccio? Puoi dare delle linee guida?

La quantificazione priva di riferimenti non esiste realmente (e Kallisto non lo è).
Ecco un progetto che cerca di creare strumenti per dati di sequenziamento ad alto rendimento senza un riferimento: https://colibread.inria.fr/project/
Due risposte:
#1
+11
Sarah Carl
2017-05-17 12:58:47 UTC
view on stackexchange narkive permalink

Prima di tutto, vorrei sottolineare che strumenti di quantificazione "privi di allineamento" come Salmon e Kallisto non sono privi di riferimenti. La differenza fondamentale tra loro e gli allineatori più tradizionali è che non riportano una posizione specifica (né in un genoma né in un trascrittoma) a cui una lettura mappa. Tuttavia, il loro scopo generale è ancora quello di quantificare i livelli di espressione (o differenze) di un insieme noto di trascrizioni; quindi, richiedono un riferimento (che potrebbe essere definito arbitrariamente).

Il criterio più importante per decidere quale approccio usare (e questo vale per quasi tutto in genomica) è esattamente quale domanda vorresti fare risposta. Se sei interessato principalmente a quantificare e confrontare l'espressione di mRNA maturo da trascritti noti, un allineamento basato sul trascrittoma può essere il più veloce e migliore. Tuttavia, potresti perdere funzionalità potenzialmente interessanti al di fuori di quelle trascrizioni note, come nuove isoforme, RNA non codificanti o informazioni sui livelli di pre-mRNA, che spesso possono essere raccolte da letture introniche (vedi EISA metodo).

Questo documento contiene anche alcune buone considerazioni su quali strumenti possono funzionare meglio a seconda della domanda a cui vuoi rispondere.

Infine, un altro L'allineatore veloce e flessibile (che può essere utilizzato con o senza un trascrittoma di riferimento) è STAR.

#2
+7
H. Gourlé
2017-05-17 11:29:37 UTC
view on stackexchange narkive permalink

Non direi che Kallisto (o Salmon) non hanno riferimenti. Usano un trascrittoma come riferimento e un concetto chiamato pseudo-allineamento che accelera notevolmente il processo di assegnazione delle letture a una trascrizione.

Detto questo, entrambi gli approcci di (i) mappatura contro un genoma di riferimento (quello che hai chiamato flusso di lavoro di allineamento ) e (ii) la mappatura rispetto a un trascrittoma di riferimento servirà a scopi diversi

La mappatura del trascrittoma utilizzando pseudoalignent sta diventando il metodo di scelta per il gene quantificazione / trascrizione e analisi di espressione differenziale. Lo svantaggio è che ti concentri solo sulle trascrizioni note

Due flussi di lavoro tipici sono:

  • Kallisto seguito da detective
  • Salmon, seguito da tximport e DESeq2 / EdgeR

La mappatura del genoma è utile, ad esempio, per la scoperta di nuove isoforme. Non dovresti più usare TopHat poiché è stato interrotto dall'autore.

Un flusso di lavoro tipico sarebbe:

  • Hisat2 (allineamento)
  • StringTie (assemblaggio della trascrizione e stima dell'abbondanza)
  • Ballgown (espressione differenziale)
Vale solo la pena notare (oltre a questa utilissima risposta) che Salmon può essere utilizzato anche con gli investigatori tramite il pacchetto [wasabi] (https://github.com/COMBINE-lab/wasabi).


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...