Domanda:
Confermare il successo o il fallimento della normalizzazione RNA-Seq
Scott Gigante
2017-05-18 05:28:24 UTC
view on stackexchange narkive permalink

Sto lavorando con una serie di dati RNA-Seq (in blocco) raccolti in più analisi, eseguiti in diversi periodi dell'anno. Ho normalizzato i miei dati utilizzando la normalizzazione delle dimensioni della libreria / quantile / RUV e vorrei verificare (quantitativamente e / o qualitativamente) se la normalizzazione è riuscita o meno a rimuovere gli effetti batch.

È importante notare che con "la normalizzazione è riuscita", intendo semplicemente che la variazione indesiderata è stata rimossa - sono necessarie ulteriori analisi per garantire che la variazione biologica non sia stata rimossa. Quali sono alcuni grafici / test statistici / pacchetti software che forniscono un controllo di qualità del primo passaggio per la normalizzazione?

Due risposte:
#1
+17
SmallChess
2017-05-18 05:49:44 UTC
view on stackexchange narkive permalink

Dovresti usare box plot e PCA plot. Diamo un'occhiata al documento della RUV:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4404308/

Prima e dopo la normalizzazione UQ :

enter image description here

Le biblioteche lo fanno non raggruppare come previsto in base al trattamento. ... per conteggi normalizzati UQ. La normalizzazione UQ non porta a un migliore raggruppamento dei campioni ...

Prima della normalizzazione, le mediane nel box-plot appaiono ovviamente molto diverse tra le repliche.

Dopo Normalizzazione UQ, le mediane sembrano più vicine ma Trt.11 sembra un valore anomalo. Inoltre, i trattamenti non sono raggruppati nella trama PCA. Dal momento che sono replicati, vorresti che fossero vicini alla trama.

Dopo la normalizzazione RUV

enter image description here

... RUVg riduce le misure di espressione per la Libreria 11 verso la mediana tra le biblioteche, suggerendo robustezza contro valori anomali. ... Le biblioteche si raggruppano come previsto dal trattamento. ...

Il RUV ha reso la distribuzione più robusta e i campioni più vicini al grafico PCA. Tuttavia, non è ancora perfetto in quanto uno dei trattamenti non è simile agli altri due sul primo PC.

La vignetta per Bioconductor RUVSeq descrive le due funzioni: plotRLE e plotPCA .

Potrei sottolineare la distinzione tra un grafico RLE (mostrato qui) e un normale grafico a scatole (una distinzione fatta a pagina 3 del preprint di aprile 2017 sui grafici RLE: visualizzazione di variazioni indesiderate in dati ad alta dimensione su https://arxiv.org/ pdf / 1704.03590.pdf). Altrimenti un'ottima risposta ma importante per spiegare cosa significa RLE.
#2
+8
Daniel Standage
2017-05-23 00:07:50 UTC
view on stackexchange narkive permalink

L'ispezione visiva con istogrammi, boxplot o altre visualizzazioni di distribuzione è la strada da percorrere. Prima della normalizzazione, le tue abbondanze potrebbero essere simili a questa. Pre-norm

Dopo la normalizzazione, dovrebbero assomigliare a questo. Post-norm

Vedi questo post del blog per il codice di esempio.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...