Küsimus:
Tööriistad VCF-st kommenteeritud variantide tabeli loomiseks
roblanf
2017-08-11 03:44:41 UTC
view on stackexchange narkive permalink

Probleem: mul on GFF- või BED-failidena VCF-fail, võrdlusgenoom ja hunnik viiteid (geenid, korduspiirkonnad jne).

Mida ma sooviksin on tööriist, mis võtab seda kõike sisendina ja väljastab võimalikult palju teavet sisaldava tabulaatori või komaga eraldatud tabeli. Väljundi potentsiaalsed veerud hõlmavad järgmist:

  1. Variandi tüüp (SNV, struktuurne jne)
  2. Variandi üksikasjad (nt võrdlusalus, variandi alus, katvus, asukoht jne )
  3. Variantidega kattuvad märkused
  4. Variandi lähedal olevad märkused (nt kas see on lihtsalt geenist ülesvoolu)
  5. Kui see ilmub kodeerivas piirkonnas, kas see muudab aminohape.

On palju tööriistu, mis teevad midagi sellist . Kuid algajale (nagu mina) ei ole selge, millistest vahenditest tasub alustada. Kuna enamus tööriistu võtab kõigepealt tööga tegelemiseks vähe vaeva, on minu küsimus järgmine:

Milline tööriist on kõige lähedasem minu kirjeldatud toimingutele, mis on usaldusväärne ja tõenäoliselt säilib järgmisteks aastateks.

Kolm vastused:
Cotton Seed
2017-08-14 09:20:38 UTC
view on stackexchange narkive permalink

Rahe võib olla teie jaoks valik.

Seda töötab aktiivselt välja kasvav meeskond Broadis. Seda on rangelt testitud (pidev integreerimine, pidev juurutamine, veateateid saavad regressioonitestid, bla-bla-bla).

See oli mõeldud selle probleemi lahendamiseks (teiste hulgas). See võib importida mitmesuguseid vorminguid, sealhulgas VCF, TSV, UCSC BED, JSON ja intervallifailid. (Meil ei ole GFF-ile selgesõnalist tuge, kuid tõenäoliselt saame nendega hakkama ka üldiste võimalustega. Kui ei, võtke ühendust ja lisame toe.) See võib helistada VEP-le (ja varsti kirjutab ka Illumina VEP-i Nirvana) . Sellel on üldised võimalused andmete teisendamiseks, filtreerimiseks, puhastamiseks ja päringute tegemiseks.

Veelgi enam, oleme kureerinud suure koguse märkuste ressursse (praegu ~ 22 annotatsioonide andmebaasi + VEP), mis on majutatud avalikus ämbris. Google'i pilves ja lõi interaktiivse päringute koostaja, et valida, milliseid ressursse soovite kasutada. Võtke ühendust, kui soovite, et lisame täiendavaid ressursse. Selle kohta saate lisateavet siit.

Kohustustest loobumine: töötan tervitusega.

Jätsin vastuvõetud vastuse FEATnotatoriks lihtsalt sellepärast, et see näib toimivat täpselt nii, nagu küsisin küsimuses. Kuid tahtsin öelda tänu, et andsite mulle (meile?) Teada Haili kohta, mis kõlab kindlasti äärmiselt kasulikuna. Aktiivne arendamine ja avatus funktsioonitaotlustele on tohutu pluss.
dkainer
2017-08-11 11:50:41 UTC
view on stackexchange narkive permalink

Olen kasutanud FEATnotatorit ja arvan, et see võib pakkuda kõiki veerge, mida soovite näha. Genereeritud on palju väljundfaile, kuid konsolideeritud väljundil on järgmised veerud:

  • kromosoom
  • positsioon
  • veerg_3
  • Consensus_Allele
  • Annotation_Signature
  • Reference_Base
  • Alternate_Base
  • Transition / Transversion SNP_Type
  • Enneaegne_STOP_Gainitud STOP_Lost
  • START_CODON
  • STOP_CODON
  • SPLICE_SITE
  • Geneetiline
  • Gene_Body
  • Intron
  • Exon
  • kodeerimine
  • UTR
  • Transcription_Start_Site
  • Lähim_geen
  • Distance

siin on mõned näited VCF-i, viidegenoomi ja GFF-i kommenteerimisfaili kasutamisest (vabandage nõrga vormingu pärast ... palju on välju!):

  Chr01 28177 TG NA TG ÜLEMINEK NA EI EI EI EI EI JAH EI EI EI EI EI EI EI EI Eucgr.A00211.v2.0 16054Chr01 44876 CG geen: Eucgr.A00211.v2.0 mRNA: Eucgr.A00211.1.v2.0 [intron] CG ÜLEMINEK NA EI EI EI EI EI EI JAH JAH EI EI EI EI NA NAChr01 46819 AG geen: Eucgr.A00211 .v2.0 mRNA: Eucgr.A00211.1.v2.0 CDS: Eucgr.A00211.1.v2.0.CDS.4 [AAA - K = > GAA - E (MISSENSE)] ekson: Eucgr.A00211.1 .v2.0.exon.4 AG ÜLEMINEK PALJU EI EI EI EI EI EI EI JAH EI JAH JAH EI EI NA NA  
arupgsh
2017-08-11 12:39:25 UTC
view on stackexchange narkive permalink

snpEff on suurepärane vahend VCF-failide märkimiseks ja saate lisada kohandatud viitejärjestusi.

http://snpeff.sourceforge.net/

Juhend kohandatud märkimisfailide lisamiseks snpEffis

https://gatkforums.broadinstitute.org/gatk/discussion/50/adding-genomic-annotations-using-snpeff-and-variantannotator

Nende andmebaasis on saadaval hulk eelnevalt kureeritud märkuste andmekogumeid.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...