Domanda:
Fgsea e Broad Institute GSEA sono equivalenti?
llrs
2017-05-19 17:32:54 UTC
view on stackexchange narkive permalink

Sono disponibili diversi metodi di arricchimento del set di geni, il più famoso / popolare è lo strumento Broad Institute. Sono disponibili molti altri strumenti (vedi ad esempio biocView di GSE che elenca 82 diversi pacchetti). Ci sono diversi parametri in considerazione:

  • la statistica usata per ordinare i geni,
  • se competitiva o autonoma,
  • se è supervisionato o meno,
  • e come viene calcolato il punteggio di arricchimento.

Sto utilizzando il pacchetto fgsea - Fast Gene Set Enrichment Analysis per calcolare i punteggi di arricchimento e qualcuno mi ha detto che i numeri sono diversi da quelli del Broad Institute nonostante tutti gli altri parametri siano equivalenti.

Questi due metodi (fgsea e Broad Institute GSEA) sono equivalenti per calcolare il punteggio di arricchimento?

Ho esaminato gli algoritmi di entrambi gli articoli e sembrano abbastanza simili, ma non so se nei set di dati reali siano equivalenti o meno.

C'è qualche articolo che esamina e confronta come il metodo del punteggio di arricchimento influisce sul risultato?

Due risposte:
#1
+7
burger
2017-05-21 01:24:45 UTC
view on stackexchange narkive permalink

Secondo il FGSEA prestampa:

Abbiamo eseguito il riferimento GSEA con parametri predefiniti. Il numero di permutazione è stato impostato su 1000, il che significa che per ogni set di geni di input sono stati generati 1000 campioni indipendenti. La corsa ha richiesto 100 secondi e ha portato a 79 set di geni con un valore q di FDR aggiustato per GSEA inferiore a 10-2. Tutti i set di geni significativi erano in una modalità positiva. Innanzitutto, per ottenere un'accuratezza dei valori p nominali simile, abbiamo eseguito l'algoritmo FGSEA su 1000 permutazioni. Ciò ha richiesto 2 secondi, ma non ha prodotto risultati significativi dovuti a correzioni di test multipli (con FRD ≤ 1%).

Pertanto, FGSEA e GSEA non sono identici.

E ancora nella conclusione:

Di conseguenza, i set di geni possono essere classificati in modo più preciso nei risultati e, cosa ancora più importante, possono essere applicati metodi di correzione di test multipli standard invece di metodi approssimativi come in [GSEA].

L'autore sostiene che FGSEA è più preciso, quindi non può essere equivalente.

Se sei interessato specificamente al punteggio di arricchimento, che è stato affrontato dall'autore nei commenti di preprint:

I valori dei punteggi di arricchimento e dei punteggi di arricchimento normalizzati sono gli stessi sia per la versione generica che per fgsea.

Quindi quella parte sembra essere la stessa.

Sì, il prestampa parla molto di come i valori p vengono calcolati in modo diverso, ma stavo chiedendo se i punteggi di arricchimento sono gli stessi o meno, ero consapevole dei diversi modi di calcolare i valori p. Trovo la risposta dell'autore stesso
Scusate. Non mi rendevo conto che stavi chiedendo specificamente del punteggio di arricchimento. Puoi modificare la domanda per renderla più ovvia.
#2
+4
llrs
2017-05-21 15:41:34 UTC
view on stackexchange narkive permalink

Ho scoperto che l'autore ha risposto che nella discussione nel preprint,

Mi chiedo che il punteggio di arricchimento sia calcolato allo stesso modo di quello in generale?

I valori dei punteggi di arricchimento e dei punteggi di arricchimento normalizzati sono gli stessi sia per la versione generica che per fgsea.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...