Probleem: mul on GFF- või BED-failidena VCF-fail, võrdlusgenoom ja hunnik viiteid (geenid, korduspiirkonnad jne).
Mida ma sooviksin on tööriist, mis võtab seda kõike sisendina ja väljastab võimalikult palju teavet sisaldava tabulaatori või komaga eraldatud tabeli. Väljundi potentsiaalsed veerud hõlmavad järgmist:
- Variandi tüüp (SNV, struktuurne jne)
- Variandi üksikasjad (nt võrdlusalus, variandi alus, katvus, asukoht jne )
- Variantidega kattuvad märkused
- Variandi lähedal olevad märkused (nt kas see on lihtsalt geenist ülesvoolu)
- Kui see ilmub kodeerivas piirkonnas, kas see muudab aminohape.
On palju tööriistu, mis teevad midagi sellist . Kuid algajale (nagu mina) ei ole selge, millistest vahenditest tasub alustada. Kuna enamus tööriistu võtab kõigepealt tööga tegelemiseks vähe vaeva, on minu küsimus järgmine:
Milline tööriist on kõige lähedasem minu kirjeldatud toimingutele, mis on usaldusväärne ja tõenäoliselt säilib järgmisteks aastateks.