Domanda:
Metodi di normalizzazione con RNA-Seq ERCC spike in?
SmallChess
2017-05-17 10:24:25 UTC
view on stackexchange narkive permalink

ERCC spike-in è un insieme di controlli sintetici sviluppati per RNA-Seq. Mi interessa usarlo per normalizzare i miei campioni di RNA-Seq. In particolare, vorrei utilizzare gli spike-in per rimuovere pregiudizi tecnici e qualsiasi variazione che non dovrebbe far parte della mia analisi.

Il sito non fornisce dettagli su come posso farlo .

D: Quali sono le possibili strategie di normalizzazione? Puoi descriverli brevemente?

Sei interessato all'RNA-seq di massa o monocellulare? Il valore degli spike-in è molto diverso a seconda di ciò
Due risposte:
#1
+9
Scott Gigante
2017-05-17 10:43:41 UTC
view on stackexchange narkive permalink

Potresti considerare di utilizzare RUVSeq. Ecco un estratto dalla pubblicazione Nature Biotechnology del 2013:

Valutiamo le prestazioni dei controlli di picco dell'RNA Control Consortium (ERCC) esterno e indaghiamo la possibilità di usandoli direttamente per la normalizzazione. Mostriamo che gli spike-in non sono abbastanza affidabili per essere utilizzati nelle procedure standard di normalizzazione basate su scala globale o regressione. Proponiamo una strategia di normalizzazione, chiamata rimuovi variazioni indesiderate (RUV), che regola gli effetti tecnici di disturbo eseguendo analisi fattoriali su set adeguati di geni di controllo (ad esempio, ERCC spike-in) o campioni (ad esempio, repliche di librerie). >

RUVSeq adatta essenzialmente un modello lineare generalizzato (GLM) ai dati dell'espressione, dove la matrice dell'espressione $ Y $ è una matrice $ m $ per $ n $, dove $ m $ è il numero di campioni e $ n $ il numero di geni. Il modello si riduce a

$ Y = X * \ beta + Z * \ gamma + W * \ alpha + \ epsilon $

dove $ X $ descrive le condizioni di interesse ( es. trattamento vs. controllo), $ Z $ descrive le covariate osservate (es. sesso) e $ W $ descrive covariate non osservate (es. batch, temperatura, laboratorio). $ \ beta $, $ \ gamma $ e $ \ alpha $ sono matrici di parametri che registrano il contributo di $ X $, $ Z $ e $ W $ e $ \ epsilon $ è rumore casuale. Per sottoinsiemi di geni accuratamente selezionati (ad esempio, picchi ERCC, geni di manutenzione o repliche tecniche) possiamo presumere che $ X $ e $ Z $ siano zero e trovare $ W $ - la "variazione indesiderata" nel tuo campione.

#2
+4
gringer
2017-08-02 03:16:10 UTC
view on stackexchange narkive permalink

Abbiamo aggiunto picchi ERCC a tutti i nostri dati RNASeq, nel caso in cui altre persone potessero trovarli utili in futuro. Tuttavia, non l'ho mai usato nelle mie analisi perché non riesco a pensare a un modo ragionevole in cui possa essere utilizzato.

La raccomandazione tipica per ERCC è di aggiungerlo in proporzione alla quantità di RNA di input , ma ciò presuppone che i conteggi totali dell'RNA cellulare siano simili tra le diverse cellule (il che è dimostrabilmente falso osservando i risultati di RNASeq di una singola cellula).

Devo ancora pensare a una situazione in cui ERCC fornirebbe migliori risultati rispetto a un set di geni "housekeeping" campionato dalle letture originali.

Perché dovresti aumentare l'ERCC se non ne hai alcuna utilità?
Facciamo la stessa cosa, la profondità di sequencing necessaria è davvero piccola, quindi è economica e "meglio prevenire che curare".
Abbiamo cercato di trovare cose da aggiungere che avrebbero significato che non avremmo avuto bisogno di ripetere le corse in futuro.
Un potenziale vantaggio è che se sembri un bias estremo in alcuni campioni (ad esempio un'ENORME% di letture che vanno a ERCC), allora sai che qualcosa è andato storto con gli acidi nucleici (ad esempio cattiva estrazione, input troppo basso, ecc ...).
Sì, immagino che gli ERCC siano un controllo positivo ragionevole per la preparazione del campione. Questi problemi di preparazione del campione tendono a emergere anche attraverso altri mezzi (ad es. Alta proporzione di mappatura ribosomiale, bassa velocità di mappatura, differenza GC, numero di trascritti espresso sopra il livello X, PCA).


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...