Sto cercando di costruire la pipeline di pre-elaborazione presentata in The Tabula Muris Consortium et al. (pp).
È una pipeline per pre-elaborare i dati di sequenziamento di una singola cella. C'è un passaggio che non è chiaro:
I conteggi sono stati normalizzati in base al log (log (1 + conteggi per N)), quindi scalati mediante regressione lineare rispetto al numero di letture (o UMI), la percentuale di letture mappate su Rn45 e la percentuale di letture su geni ribosomiali.
Capisco la prima parte (presumo che il log in questo contesto sia log2), ma ho bisogno di aiuto su capire come scalare in base alla regressione lineare rispetto al numero di letture, la percentuale di letture mappata a Rn45 e la percentuale di letture a geni ribosomiali.