Küsimus:
GRCh38 vcf-fail tavaliste vähimutatsioonidega
719016
2017-06-15 16:56:52 UTC
view on stackexchange narkive permalink

Kas GRCh38 koosseisus on vcf-fail koos levinud vähimutatsioonidega, mida saan kuskilt alla laadida? Võib-olla ühest suurest rahvusvahelisest vähi genoomika konsortsiumist?

Tavalise all mõtlen ma seda, millised mutatsioonid on leitud korduvat erinevat tüüpi vähi korral.

Kuidas te seda määratleksite? Kas mõni variant on leitud> 1 vähitüübist? Mitmel patsiendil? Kas peate siis välistama variandid, mida leidub ainult ühes vähiliigis? Kas need peaksid olema ainult põhjuslikud variandid? Mis siis, kui variant on leitud kolmelt erinevalt vähihaigelt, kuid sellel pole vähiga mingit seost? Ja jah, see pole mitte ainult võimalik, vaid juhtub ka peaaegu kindlasti, kuna paljud variandid on populatsioonis väga levinud. Kas soovite seda piirata variandi sagedusega? [Muutke] oma küsimust ja kitsendage seda.
@terdon Tundub, et oletate, et ta tegeleb populatsioonigeneetikaga, mis võib juhtuda või mitte. Vähigeneetikas hoolivad nad tavaliselt ainult somaatilistest variantidest, nii et see välistab automaatselt "variandid on populatsioonis väga levinud". Ma arvan, et küsimus vajab tegelikult selgitust iduliini versus somaatiliste mutatsioonide kohta.
Kolm vastused:
burger
2017-06-18 22:04:43 UTC
view on stackexchange narkive permalink

Kui otsite vähimutatsioone, on peamine ressurss COSMIC ja need pakuvad GRCh38 VCF-sid. Allalaadimisleht on siin: http://cancer.sanger.ac.uk/cosmic/download

See, kuidas määrate „tavaline”, sõltub teile VCF sisaldab palju teavet, mida saate kasutada.

terdon
2017-06-15 17:55:47 UTC
view on stackexchange narkive permalink

Teie küsimus ei anna konkreetse vastuse jaoks piisavalt teavet, kuid see peaks algul toimuma.

  1. Hankige NCBI-lt VCF-fail, mis kirjeldab kõiki Clinvari variante:

      wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz  
  2. Ekstraheerige kõik variandid, mille VCF-rida sisaldab sõna "vähk":

      zgrep -iE '^ # | CLNDBN = [^;] * vähk' clinvar.vcf.gz > cancer.vcf 

Nüüd peaksite seda tõenäoliselt veelgi filtreerima, lähtudes variandi sagedusest, vähi tüübist jne jne, kuid see peaks olema hea algus.

gringer
2017-06-15 18:22:39 UTC
view on stackexchange narkive permalink

Vähiga seotud variantide otsimise probleem on see, et põhjuslike variantide võltsmõju (nt etniline kuuluvus) võib olla keeruline välja visata. Kui olete huvitatud sellest, millised geenid on seotud enamiku vähitüüpidega, on paneelide NanoString märkused üsna head:

Nende lehtede jaotises „Tugidokumendid“ on link Exceli failile koos geeniloendite ja sondiga järjestused. Kuigi need loendid ei anna teavet funktsioone häirivate variantide kohta, näen ma natuke vaeva, et mõelda läbi, miks oleks seda eelnevalt kasulik teada, välja arvatud juhul, kui eesmärk on CRISPR-i vms kaudu vähki esile kutsuda.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...