Küsimus:
Kuidas teha funktsionaalset analüüsi R-i geeniloendis?
J0HN_TIT0R
2017-06-12 22:45:52 UTC
view on stackexchange narkive permalink

RNA-seq katse põhjal on mul kahe proovi tingimuse korral umbes 17000 geeni ID, mis on paigutatud vastavalt nende log2-kordsetele muutustele võrreldes kontrolliga. Pean neid märkima, kuid ma pole kunagi varem märke teinud ja mõtlen, kuidas seda R.-s teha.

Mind huvitab kaasatud geenide radade üles-alla reguleerimine. Mulle meeldiks saada ka rikastamist ja p-väärtuse analüüsi. Mind huvitab, kas R-is on selle analüüsi jaoks olemas PANTHERiga sarnane pakett või mitte. Olen lugenud, kuidas erinevad annotatsiooniprogrammid võivad olla paremad või halvemad; tundub, et PANTHER on palju parem kui DAVID, nii et ma mõtlesin, kas on pakett, mis pakub R-is PANTHER-i sarnaseid analüüse. parim?

Mind huvitavad peamiselt inimproovid ja kommenteeritud teed.

Värskendasin teie küsimust selle teabega. Millised geeni ID-d teil praegu on (nt Ensembl, refseq jne)?
Kuidas määratlete kõige paremini? Mida soovite teada, kas geenid on kooskõlastatud, radad, mis on reguleeritud alla või üles? Kas soovite GSEA ühe või terve valimi, konkurentsivõimelist või mittekonkureerivat? Minu jaoks on see küsimus selline, nagu mul oleks nimekiri numbritest, mida soovin kõige olulisemate saamiseks mõne toimingu teha, milline meetod on saadaval?
Kommenteerijale vastamiseks kasutage @J0HN_TIT0R @ hüüdnime. Selle uue teabe lisamiseks [muutke] küsimust.
Praeguses olukorras ei saa sellele küsimusele vastata. @J0HN_TIT0R ei anna piisavalt taustainfot selle kohta, milline funktsioon * teid huvitab ja miks: see otsustab väga palju, millist rikastamis- ja rikastamisvahendit saame soovitada. Samuti ei soovitata SE-s küsimusi "parima tööriista" kohta, kuna need põhinevad peamiselt arvamusel.
Kolm vastused:
Devon Ryan
2017-06-13 02:52:41 UTC
view on stackexchange narkive permalink

NB, ma väldin "parima" arutelu, kuna sellele on enam-vähem võimatu vastata.

Teie küsimuse võib tegelikult jagada kaheks:

  1. Mis on hea radaede analüüsi tööriist (ideaalis R-s)?
  2. Millised on head rajaallika teabe allikad?

(1) jaoks on mõned erinevad võimalused , kuid ma eelistan kas röstimist või kaamerat limmast või goseqist (eraldiseisev biojuhtide pakett). Neist eeldan, et röstitud või goseqi tooted on kõige sarnasemad pantri omadega selles mõttes, et nad pole konkurentsivõimelised. Kuna geenid on siiski omavahel seotud, eelistan ma võistluskatseid, nagu kaamera pakub.

Punkti (2) puhul on teie valikud põhimõtteliselt KEGG või reaktoom. KEGG on problemaatiline, kuna teil on vaja kaugeleviimiseks litsentsi (selle lahendamiseks on mõned R-paketid, kuid mul pole aimugi, kui koššerid nad seaduslikult on). Arvestades seda, võib reaktomee olla teie parim valik.

Selle kõige kirjutades on IPA parim andmebaas seal. See on kommertstoode (mul pole sidet), kuid võite saada demolitsentsi, mis töötab vähemalt paar nädalat. Kui teete analüüse suhteliselt sageli, on mõttekas litsentsile veidi raha kulutada (võib-olla jagada naabergruppidega).

Sõltumata sellest, mida kasutate, võiksite kasutada ka teekonnavaade, mis võib luua hõlpsasti tõlgendatavad joonised, mis on seotud raja rikastamisega.

Ma ei nõustu sellega, et IPA on parim (arvasin, et tahate oma vastuses parimat vältida). IPA on kaubanduslik ja ei ole läbipaistev, vaid must kast. Peate usaldama, et ettevõte tegi selle andmebaasi kulisside taga head tööd, mis tegelikult ei peakski teadus olema. Ainult minu mõtted.
llrs
2017-06-13 20:23:02 UTC
view on stackexchange narkive permalink

Taotlesite tööriista, mis on sarnane PANTHER -ga, kuid R. protsess) ja rajad.

AFAIK-is pole R-is tööriista, mis kõik need ühte integreeriks, kuid mitu paketti teevad sellest tükki. Kuid minu tähelepanekud pärast selle paar korda kasutamist on need, mis põhinevad palju geenide ontoloogiates. Geeni ontoloogiad (GO) ei ole radad, kuid parim tööriist, mille GO jaoks leidsin, on topGO (natuke raske kasutada, kuid kasulik saada ülevaadet bioloogiast), mis testivad termini esitusi antud nimekiri.

Erik
2018-05-04 03:28:30 UTC
view on stackexchange narkive permalink

Ma läheksin topGO paketi juurde. Teie torujuhtme loogilised sammud oleksid järgmised:

1) Koostage maatriks järgmiste muutujatega:

| gene_ID | GO_ID | GO_term_description | Uniprotkb-le saate sisestada uniproti ID-de loendi ja leidke oma loendis / failis kõigi geenide GO märkused.

2) filtreerige see loend geenide jaoks, mis on teie diferentsiaalse ekspressioonianalüüsi käigus püütud, isegi kui neid pole erinevalt väljendatud. Selle filtri määratleb DESeq / Sleuth järgmiselt: "vähemalt 4 lugemisarvu vähemalt 49% raamatukogudest".

3) Määratlege see geenide loend kui gene_universe

4) määrake oma geenikomplekt ja hankige geenide ID-d ning võimaluse korral ka teid huvitavate geenide paremusjärjestus (p-val / FDR).

5) joonistage graafikud ja hankige rikastatud GO-terminite tabelid (need järjestatakse p-väärtuse järgi, ilma et oleks vaja teha parandusanalüüsi.

Märkus: vajate mõnda andmete manipuleerimise funktsiooni; ma loeksin dokumenti "tidyverse"



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...