Domanda:
Come si può stimare il contributo della linea cellulare dai dati RNASeq?
llrs
2017-05-30 12:30:54 UTC
view on stackexchange narkive permalink

Utilizzando una microdissezione a cattura laser di cellule, è stato sequenziato un gruppo di cellule colorate con il marker di interesse. In un'altra coorte di pazienti (questo è tutto tessuto epatico umano) l'intero tessuto è stato sequenziato (RNA-seq in entrambi i casi)

Posso stimare il contributo delle cellule marcate nell'intero fegato ("peso di queste cellule "nel fegato nelle parole del mio PI)?

La mia sensazione istintiva è che non possa essere fatto in questo modo, richiederebbe sia il sequenziamento di una singola cellula che il sequenziamento dell'intero tessuto per stimare il contributo di ogni linea cellulare. Ma forse esiste uno strumento che, date le linee cellulari o l'espressione principale di altre linee cellulari, può essere paragonato all'uso di GSVA o uno strumento simile.

Hai esaminato gli strumenti per la stima delle miscele (è quello che stai facendo)? Quanto deve essere precisa la stima?
Non ho sentito parlare di stima della miscela, quindi non ho cercato strumenti con quella parola chiave. Non ho un requisito di precisione, più è meglio è: D. Ma sospetto che i miei dati non siano molto buoni (ho solo 6 repliche tecniche della microdissezione laser) quindi non posso aspettarmi molto.
Quattro risposte:
#1
+6
Iakov Davydov
2017-06-01 14:01:04 UTC
view on stackexchange narkive permalink

Ci sono un paio di metodi computazionali che cercano di farlo (non li ho mai usati, quindi nessuna esperienza):

  1. CellMix, basato su set di geni marcatori elenchi
  2. Previsione dei sottoinsiemi dalla correlazione dell'arricchimento, che si basa sulle correlazioni con geni specifici dei sottoinsiemi in un insieme di campioni.
  3. Arricchimento del tipo di cella, che utilizza il nostro database di geni specifici delle cellule, altamente espressi
  4. Analisi della significatività specifica del tipo di cellula utilizzando l'espressione genica differenziale per ogni tipo di cellula
  5. ol >

    Potrebbe essere necessario ottenere alcuni livelli di espressione di riferimento da database o documenti pubblici per alcuni metodi.

    Una cosa da tenere a mente: non è possibile calcolare realmente la proporzione delle cellule, ma solo la proporzione dell'RNA. Se hai una buona ragione per presumere che la quantità di RNA per cellula sia molto simile, questo è un buon indicatore della proporzione di cellule in un tessuto.

Bei riferimenti. Avrò in mente questa limitazione. Grazie
#2
+4
gringer
2017-06-01 17:48:19 UTC
view on stackexchange narkive permalink

La deconvoluzione cellulare è menzionata in questo post di Biostars, che menziona CIBERSORT per le miscele di cellule immunitarie, e il pacchetto Bioconductor DeconRNASeq.

Per quanto riguarda Sono consapevole che è possibile solo nella migliore delle ipotesi ottenere una rappresentazione proporzionale per l'espressione del trascritto da risultati di sequenziamento standard ad alta produttività, perché i sequenziatori e il flusso di lavoro di preparazione del campione sono progettati in modo tale che lo stesso numero di letture venga prodotto importo di input.

CIBERSORT sembra uno strumento carino, vale la pena provare.
#3
  0
Dr_Hope
2020-08-18 19:18:02 UTC
view on stackexchange narkive permalink

È possibile scaricare dati RNA-seq a singola cellula pubblici o RNA-seq in blocco per cellule primarie purificate come riferimento e quindi utilizzare CIBERSORT o MuSiC per deconvolgere. compatibile, TPM da RNA-seq può essere confrontato con CPM in dati a cella singola 3 '(10X, Drop-seq ecc.) e TPM in dati a cella singola a lunghezza intera (SMARTseq ecc.)

#4
  0
Reza Rezaei
2020-08-18 21:31:11 UTC
view on stackexchange narkive permalink

In realtà un mese fa, stavo cercando la stessa domanda e ho trovato alcuni pacchetti che possono essere utilizzati. Prima di tutto la loro funzionalità può essere la stima della proporzione cellulare, la stima dell'espressione genica specifica della cellula o entrambe queste funzioni. In secondo luogo, il loro input principale, come previsto, sono dati RNA-seq in massa e alcuni vogliono anche dati RNA-seq a singola cellula come input secondario. Il più popolare è il figlio del famoso cibersort, CIBERSORTX. Ho visitato il loro sito Web e ho letto i tutorial. Hanno diversi set di dati di esempio che possono essere utilizzati per apprendere la loro piattaforma. Tuttavia, i due maggiori difetti erano che non hanno condiviso il loro codice sorgente, il che significa che non possiamo riprodurre il risultato sui nostri sistemi e dobbiamo caricare tutti i nostri dati sui server di Stanford (problemi di sicurezza!). Il secondo problema è che non c'è accesso API al loro server e tutto dovrebbe essere fatto online, il che significa una compatibilità molto bassa con altri strumenti.

L'idea, utilizzando la deconvoluzione e l'apprendimento profondo per dedurre la sottopopolazione di celle dalla massa RNA-seq, è fantastico. Quindi, ho cercato per vedere se anche altri hanno fatto qualcosa di simile e forse anche meglio. Ho trovato altri tre strumenti:

  1. MuSiC: https://www.nature.com/articles/s41467-018-08023-x
    Pubblicato in comunicazione sulla natura e qualche mese più vecchio di cibersortx. Non ho ancora studiato il loro algoritmo e quindi non posso dire se il loro metodo sia migliore di cibersortx oppure no. Tuttavia, la parte che fa la differenza è che tutti i loro lavori, incluso il codice sorgente, sono open-source. Quindi, posso accedere al loro codice e non è necessario caricare i nostri dati non pubblicati in un server online non sicuro (a differenza di cibersortx). La seconda cosa buona è che è implementato nel linguaggio R che uso per la maggior parte della mia analisi dei dati RNA-seq, quindi è facilmente compatibile con altri strumenti.

  2. Scaden: https://advances.sciencemag.org/content/6/30/eaba2619.full Anche questo è open-source e accessibile facilmente. È scritto in Python e viene eseguito nella shell. Quindi, è in qualche modo compatibile con altri strumenti (non compatibile come MuSic). Possiamo nuovamente elaborare i nostri dati localmente e non è necessario caricare i nostri dati su alcun server (il che è positivo). Affermano che il loro metodo ha una migliore correlazione con i dati scRNA-seq reali rispetto sia a cibersortx che a MuSic (non sempre !!). L'esecuzione dei loro strumenti sembra facile in base ai loro tutorial (non l'ho ancora eseguito sul mio sistema!). Tuttavia, i loro tutorial sembrano essere un po 'confusi e sembra che sia ancora in versione pre-rilascio e hanno dei bug !!

  3. CDSeq: https: / /github.com/kkang7/CDSeq_R_Package Infine, ho trovato il pacchetto CDSeq che non necessita di alcun input di scRNA-seq per trovare le proporzioni delle singole cellule e l'espressione genica specifica delle cellule nei dati di massa. Ottiene solo il tuo valore come input e informazioni su pochissimi parametri e fa tutto automaticamente, e sorprendentemente bene, ho controllato! Se potessi trovare il pattern di espressione genica delle tue cellule specifiche e usarlo anche come input, è opzionale, ti darà una stima ancora migliore.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...