Ridimensionamento per regressione lineare rispetto al numero di letture

gc5

2017-12-28 03:24:17 UTC

view on stackexchange narkive permalink

Sto cercando di costruire la pipeline di pre-elaborazione presentata in The Tabula Muris Consortium et al. (pp).

È una pipeline per pre-elaborare i dati di sequenziamento di una singola cella. C'è un passaggio che non è chiaro:

I conteggi sono stati normalizzati in base al log (log (1 + conteggi per N)), quindi scalati mediante regressione lineare rispetto al numero di letture (o UMI), la percentuale di letture mappate su Rn45 e la percentuale di letture su geni ribosomiali.

Capisco la prima parte (presumo che il log in questo contesto sia log2), ma ho bisogno di aiuto su capire come scalare in base alla regressione lineare rispetto al numero di letture, la percentuale di letture mappata a Rn45 e la percentuale di letture a geni ribosomiali.

Hai contattato gli autori della carta? Sarebbero in grado di darti una risposta migliore ei tuoi commenti / domande li aiuterebbero a migliorare il documento quando sarà pubblicato correttamente.

@gringer Hai ragione, l'ho postato qui perché pensavo ci fosse una procedura standard.

La regressione lineare è abbastanza semplice, ma regredire solo rispetto a tre valori (se lo sto interpretando correttamente) è una ricetta per il disastro (suona molto peggio persino dei picchi ERCC ... e quelli non sono esattamente ideali ).

@DevonRyan ignorando ormai l'esiguo numero di valori di regressione, come si scala utilizzando la regressione lineare? Non sono in grado di vedere come viene utilizzata la regressione lineare in questo caso. Puoi approfondire di più (magari con una risposta)?

Hai capito come hanno preelaborato i dati della tabula muris?

@yuqi_yuqi vedi https://bioinformatics.stackexchange.com/a/3225/1771