Ho letto i dati dei conteggi e desidero convertirli in valori RPKM. Per questa conversione ho bisogno della lunghezza del gene.
La lunghezza del gene deve essere calcolata in base alla somma delle lunghezze esoniche codificanti? O ci sono modi diversi per farlo?
So che la lunghezza del gene può essere presa dal file Gencode GTF v19. Potresti dirmi come viene calcolata la Gene_length
?
I dati che ho sono dati RNA-Seq. Non ho idea se devo includere UTR in questo calcolo o solo esoni?
In Github ho visto calcolo RPKM dai dati Counts con Gene_length dal file Gencode GTF. Pensi che questo sia il modo giusto di calcolo?
E perché RPKM è - Non è per l'analisi differenziale. Per la sottotipizzazione TNBC utilizzano dati di microarray. Vorrei provare con i dati RNA-Seq. Quindi per questo sto provando in modo diverso e nel modo giusto.