Domanda:
mappature da sonda a sonda tra array Affymetrix
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Mi interessa identificare le mappature tra diversi tipi di array Affymetrix. Sono consapevole del fatto che le mappature tra gene e probeset possono essere estratte utilizzando il database Biomart di Ensembl.

  ID gene Ensembe ENSG00000181019 mappato a 1. AFFY HG-U133_Plus_2's 210519_s_at2. AFFY HuGene-1_0-st-v1's 8002303  

Esiste un modo per estrarre le mappature degli ID del probe tra due array (ad esempio: HG-U133_Plus_2, HuGene-1_0-st-v1)?

  ad esempio: 210519_s_at e 8002303  
La tua domanda è come trovare set di sonde sovrapposti tra gli array? O come identificare i set di sonde in generale? Non è chiaro.
Ho aggiunto un esempio. Ha senso adesso?
Quindi in pratica puoi recuperare due mappature gene-id da Biomart di Ensembl. Corretta? Cosa ti impedisce di unire queste due tabelle basate sull'ID del gene Ensembl? Puoi usare la funzione `merge` in R o l'istruzione` JOIN` in SQL.
Anche @IakovDavydov o un `join` di Unix funzionerebbero
Il problema è: tutte le mappature non sono esattamente uno a uno. Entrambi i set di sonde di HG-U133_Plus_2 o HuGene-1_0-st-v1 mappati a un id gene dell'ensembl.
@Prradep se spieghi qual è il problema di fondo che stai cercando di risolvere, potremmo essere in grado di offrire consigli migliori
Non dovresti necessariamente aspettarti di vedere mappature uno-a-uno, vedi la mia risposta di seguito.
Tre risposte:
#1
+9
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Se la tua domanda è: è possibile mappare gli ID dei set di sonde da piattaforme diverse in modo simile alla mappatura dei set di sonde sui geni, la risposta è: Sì. BioMart ti consente di mappare quasi tutto ciò che ha un ID a qualsiasi altro che abbia un ID.

Puoi usare BioMart tramite l'interfaccia web o in modo programmatico. Una breve guida all'uso dell'interfaccia web, per mappare HG U133 Plus 2 su HuGene 1.0:

  1. Vai alla pagina iniziale
  2. Seleziona H geni sapiens Ensembl per il database; Geni umani (GRCh38.p10) per il tuo set di dati
  3. Fai clic su Filtri nella colonna di sinistra
  4. Espandi "REGION", scorri verso il basso fino a GENE e seleziona "Input microarray probes / probesets ID list [Max 500 consigliati] "
  5. Seleziona AFFY HG U133 PLUS 2 probe ID e copia / incolla o carica un elenco, uno per riga
  6. Fai clic su Attributi a sinistra -colonna a mano
  7. Scorri, deseleziona ciò che non vuoi vedere e scegli cosa fare, ad esempio Gene Stable ID, sonda AFFY HuGene 1 0 st v1 e sonda AFFY HG U133 Plus 2
  8. Infine fai clic su "Risultati" nel menu nella parte superiore della colonna di sinistra

E dovresti vedere un risultato come questo (tu sarà necessario fare clic sul pulsante "Risultati").

Non dovresti aspettarti che ci sia una mappatura uno a uno, per due motivi:

  • I geni hanno più trascrizioni e set di sondaggi sono mappati a ciascuna trascrizione
  • Alcune trascrizioni hanno più di un set di sonde: in questo caso, gli ID HuGene 8002301 e 8002303 mappati alle trascrizioni per questo gene

Infine: ecco un esempio programmatico che utilizza R / BioMart:

  library (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") risultati <- getBM (attributes = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filtri = "affy_hg_19"), filters = "affy_hg_19" .hs) risultati ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
#2
+7
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

Invece di biomaRt, è anche possibile utilizzare i database di mappatura incorporati nello stesso Bioconductor e mappare da sonda a gene, e poi da gene a sonda nel secondo. Un po 'di codice R da convertire tra hgu133 e hgu95 utilizzando lo stesso ID sonda fornito in un altro:

  library (hgu133plus2.db) library (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, chiavi = query_probe, colonne = "ENSEMBL") ensembl_hgu95 <- select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", colonne = "PROBEID") dplyembl_gu95 , da = "ENSEMBL", suffisso = c (". 133", ".95"))  
#3
+2
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Altre risposte spiegano perché potrebbe non esserci una mappatura uno a uno tra le sonde.

Il database AbsID esegue la conversione in base alla mappatura delle sequenze della sonda in una build del genoma e quindi determina le mappature in base alle coordinate di allineamento del genoma sovrapposte. Questo è davvero utile se vuoi essere sicuro che due sonde siano effettivamente probabili misurando la stessa trascrizione.

Tuttavia, dipende dall'allineamento di entrambe le sonde al genoma.

Dichiarazione di non responsabilità: ho lavorato nel gruppo che fornisce lo strumento di mappatura AbsID.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...