Küsimus:
sondide määramine Affymetrixi massiivide vaheliste kaardistuste sondeerimiseks
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Mind huvitab eri tüüpi Affymetrixi massiivide vastenduste tuvastamine. Olen teadlik, et kaardistusi geeni ja sondide vahel saab ekstraheerida Ensembli andmebaasi Biomart abil.

  Ensembe geeni ID ENSG00000181019 kaardistab 1. AFFY HG-U133_Plus_2 210519_s_at2. AFFY HuGene-1_0-st-v1 8002303  

Kas on mingil moel võimalik prooviseadete ID-de vastendusi kahe massiivi vahel välja tõmmata (nt: HG-U133_Plus_2, HuGene-1_0-st-v1)?

  nt: 210519_s_at ja 8002303  
Kas teie küsimus on, kuidas leida massiivide vahel kattuvaid sondikomplekte? Või kuidas sondikomplekte üldiselt tuvastada? See ei ole selge.
Olen lisanud näite. Kas sellel on nüüd mõtet?
Nii et põhimõtteliselt saate Ensembli Biomartist hankida kaks geeni-id-kaardistust. Õige? Mis takistab teil nende kahe Tabeliga liitumist Ensembli geeni ID põhjal? Funktsiooni R ühendada saate kasutada R-s või SQL-is lauset "JOIN".
Töötaks ka @IakovDavydov või Unixi "liitumine"
Probleem on: kõik kaardistused pole täpselt üks ühele. Kas HG-U133_Plus_2 või HuGene-1_0-st-v1 sondid, mis kaardistatakse ühe ansambli geeni id-ga.
@Prradep, kui selgitate, mis on probleem, mida proovite lahendada, võiksime pakkuda paremat nõu
Te ei tohiks eeldada, et näete üks-ühele vastendusi, vaadake minu vastust allpool.
Kolm vastused:
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Kui teie küsimus on järgmine: kas erinevate platvormide sondide ID-sid saab üksteisega kaardistada sarnaselt sondide ja geenide kaardistamisele, siis on vastus: Jah. BioMart võimaldab teil kaardistada peaaegu kõik, millel on ID, kõigega, millel on ID.

BioMarti saate kasutada kas veebiliidese kaudu või programmeeritult. Lühike juhend veebiliidese kasutamiseks HG U133 Plus 2 kaardistamiseks HuGene 1.0-ga:

  1. minge avalehele
  2. valige H . sapiens Ensembli geenid teie andmebaasi jaoks; Inimgeenid (GRCh38.p10) teie andmekogumi jaoks
  3. Klõpsake vasakpoolses veerus valikut Filtrid
  4. Laiendage "REGION", kerige alla GENE-ni ja valige "Input microarray probes / probesets ID loend [soovitatav maksimaalselt 500] "
  5. Valige AFFY HG U133 PLUS 2 sondi ID (d) ja kas kopeerige / kleepige või laadige üles loend, üks rea kohta
  6. Klõpsake vasakul atribuudid -käsi veerg
  7. Kerige läbi, tühjendage märkeruut, mida te ei soovi näha, ja valige, mida teete, näiteks Gene Stable ID, AFFY HuGene 1 0 v vond ja AFFY HG U133 Plus 2 sond
  8. Lõpuks klõpsake vasaku veeru ülaosas asuvas menüüs valikut "Tulemused"

Ja peaksite nägema sellist tulemust ( pean klõpsama nuppu „Tulemused“).

Te ei tohiks eeldada, et tegemist on üks-ühele kaardistamisega, kahel põhjusel:

  • Geenid on igale transkriptsioonile kaardistatakse mitu transkripti ja sonde
  • Mõnel transkriptsioonil on rohkem kui üks sondikomplekt: sellisel juhul kaardistatakse HuGene ID 8002301 ja 8002303 transkriptsioonidega see geen

Lõpuks: siin on programmiline näide, mis kasutab R / BioMart:

  teek (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") tulemused <- getBM (atribuudid = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filtrid = "210__gg_u_53" .hs) tulemused ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

BiomaRt asemel on võimalik kasutada ka Bioconductorisse sisseehitatud kaardistusandmebaase ja kaardistada sondid geenidena ning seejärel geenidelt sondidelt. Mõni R-kood hgu133 ja hgu95 vahel teisendamiseks, kasutades teises sondi ID-d:

  library (hgu133plus2.db) library (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, võtmed = päringu_probe, veerud = "ENSEMBL") ensembl_hgu95 < - vali (hgu95av2.db, võtmed = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", veerud = "PROBEID") dplyr :: internal_join , autor = "ENSEMBL", järelliide = c (". 133", ".95"))  
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Teised vastused selgitavad, miks sondide vahel ei pruugi olla üks ühele kaardistamine.

AbsID andmebaas teisendab sondijärjestuste kaardistamise põhjal genoomi järku ja seejärel määrab kaardistused genoomi kattuvate koordinaatide põhjal. See on tõesti kasulik, kui soovite olla kindel, et kaks sondi mõõdavad sama transkripti tegelikult tõenäoliselt .

See sõltub siiski mõlemast sondist, mis joondub genoomiga.

Kohustustest loobumine: töötasin grupis, mis pakub AbsID-kaardistamise tööriista.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...