Domanda:
Ridimensionamento per regressione lineare rispetto al numero di letture
gc5
2017-12-28 03:24:17 UTC
view on stackexchange narkive permalink

Sto cercando di costruire la pipeline di pre-elaborazione presentata in The Tabula Muris Consortium et al. (pp).

È una pipeline per pre-elaborare i dati di sequenziamento di una singola cella. C'è un passaggio che non è chiaro:

I conteggi sono stati normalizzati in base al log (log (1 + conteggi per N)), quindi scalati mediante regressione lineare rispetto al numero di letture (o UMI), la percentuale di letture mappate su Rn45 e la percentuale di letture su geni ribosomiali.

Capisco la prima parte (presumo che il log in questo contesto sia log2), ma ho bisogno di aiuto su capire come scalare in base alla regressione lineare rispetto al numero di letture, la percentuale di letture mappata a Rn45 e la percentuale di letture a geni ribosomiali.

Hai contattato gli autori della carta? Sarebbero in grado di darti una risposta migliore ei tuoi commenti / domande li aiuterebbero a migliorare il documento quando sarà pubblicato correttamente.
@gringer Hai ragione, l'ho postato qui perché pensavo ci fosse una procedura standard.
La regressione lineare è abbastanza semplice, ma regredire solo rispetto a tre valori (se lo sto interpretando correttamente) è una ricetta per il disastro (suona molto peggio persino dei picchi ERCC ... e quelli non sono esattamente ideali ).
@DevonRyan ignorando ormai l'esiguo numero di valori di regressione, come si scala utilizzando la regressione lineare? Non sono in grado di vedere come viene utilizzata la regressione lineare in questo caso. Puoi approfondire di più (magari con una risposta)?
Hai capito come hanno preelaborato i dati della tabula muris?
@yuqi_yuqi vedi https://bioinformatics.stackexchange.com/a/3225/1771
Una risposta:
DCZ
2018-04-20 12:52:05 UTC
view on stackexchange narkive permalink

Non so se questa domanda sia già stata risolta, ma quello che cercano di fare è equalizzare la profondità del sequenziamento per ogni cella. Pertanto, si adattano al numero totale di letture. Se regredisci (tramite regressione binomiale lineare o negativa) le differenze nel numero di letture per cella, ti ritroverai con celle che sono state sequenziate con la stessa profondità.

Secondo me usano i geni ribosomiali allo stesso modo. Sono considerati una specie di geni di pulizia, che puoi usare per equalizzare la profondità di sequenziamento.

E sì, il log in questo contesto è log2, usato per ottenere valori di fold-change invece dei conteggi.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...