Küsimus:
Kust leida sebrakala ja riisi genotüüpide ja fenotüüpide GWAS-andmekogumi?
Haohan Wang
2017-07-19 09:55:16 UTC
view on stackexchange narkive permalink

Minu eesmärk on töötada uurimisprojektina GWAS-meetodi arendamise kallal. Inimese genoomiandmed on aga identifitseerimisprobleemi tõttu tavaliselt konfidentsiaalsed, seega on neid väga raske hankida. (rakendus võtab kaua aega ja ma ei pruugi seda lõpuks kätte saada.)

Seetõttu ehk proovin kõigepealt teiste liikide andmetega mängida. Nii et ma ei tea, kust leida sebrakala ja riisi GWAS-andmeid. (Põhjus, miks ma neid kahte palun, on see, et leian, et teadlased kipuvad genoomianalüüsi tegema hiirtel, Arabidopsis Thaliana, sebrakaladel ja riisil ning leidsin juba, kust kahe esimese GWAS-i andmed alla laadida.)

Leian mitu andmekogumit (nt ZFIN), millel on märkustega genoomiteave, kuid see on ainult üks genoom. Kust saaksin enda analüüsi alustamiseks algandmed alla laadida (nt 500 sebrakala genotüübid ja vastavad fenotüübid)?

Võimalik duplikaat saidilt [Kust leida andmebaasi, millel on fenotüübi teave koos seotud SNP-dega?] (Https://bioinformatics.stackexchange.com/questions/2022/where-can-i-find-a-database-that-has -fenotüüp-teave-koos-assotsiatsioonidega)
@KamilSJaron Aitäh. Minu kaitseks palutakse eelmises küsimuses seonduvaid tulemusi, mida inimesed juba oma uurimistööga leiavad. Selle küsimusega otsin andmekogumit, mida saaksin uurida. Millised on erinevused inimeste ja nende liikide vahel? Tegin seda peamiselt seetõttu, et inimese genoomi andmete taotlemine võtab kaua aega ja me ei pruugi neid saada.
Teil pole vaja ennast kaitsta, püüan teid aidata küsimuse selgemaks muutmisel. Soovitaksin teil oma küsimust [redigeerida], et lisada sinna rohkem üksikasju (sealhulgas ka need, mille kommentaaris kirjutasite). Öelge meile, mida soovite, mida olete proovinud ja miks see teie arvates ei töötanud. Kui inimese probleem on andmekogumi suurus, siis miks mitte lihtsalt inimese andmekogumit alamvalimiks tuua? GWAS on aga tuntud tohutute valimite nõudmise poolest.
üks vastus:
gringer
2017-07-20 00:39:14 UTC
view on stackexchange narkive permalink

Ma arvan, et see on teie jaoks produktiivsem, kui valite ühe avalikest inimandmekogudest ja harjutate sellel oma GWAS-meetodeid. Paar näidet:

  • 1000 genoomi - kasutage seotustunnusena populatsiooni. Leiate, et teil on seos kogu genoomi ulatuses, seega muutuks analüüsimeetod "millised bitid on seotud" asemel "millised bitid on kõige järjekindlamalt seotud"

  • NCI Genomic Data Commons - avatud juurdepääsuga (ja kontrollitud juurdepääsuga) vähiga seotud andmed

Ma arvan, et vajate natuke täpsemat teavet fenotüübi kohta kui populatsioon, kui soovite proovida meetodi potentsiaali. Elanikkonna jaoks saate lihtsalt vaadata PCR-i 2. ja 3. telge ja see töötab (te ei vaja ametlikku statistikat) ...
Kuid see ei ütle teile, millised markerid on seotud. Minul on varem olnud populatsioonide GWAS-laadse analüüsi tegemine.
Võite vaadata lookuste prognoosi põhikomponentideni ja seetõttu näete, millised lookused on tegelikult eraldamise eest vastutavad. Ma ei kahtle, kas saate seostada lookusi populatsioonidega. Püüan öelda, et te ei vaja selleks keerukat meetodit, kuna signaal on väga tugev. Mulle jäi mulje, et GWAS-i uuringute väljakutse seisneb nõrkade signaalide tuvastamises, mistõttu pole võrdlusuuringute jaoks "lihtsate" andmete võtmine tegelikult kasulik (võib-olla mõistlikkuse testide jaoks).


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...