Mulle meeldib rohkem kasutada "ts / tv" ülemineku ja teisenduse suhteks. Seda lühendit on kasutatud fülogeneetikas. Kui NGS tuli, hakkasid mõned olulised arendajad kasutama teksti "ti / tv", kuid ma olen ikka veel vana konventsiooniga harjunud.
Miks on Ti / Tv juhuslike asenduste eeldatav väärtus suhe 0,5?
Põhimuudatusi on kuut tüüpi. Neist kaks on üleminekud: A<->G
ja C<->T
ja ülejäänud neli tüüpi on transverssioonid. Kui kõik oleks juhuslik, võiksite eeldada, et näete kaks korda rohkem teisendeid - ts: tv = 2: 4 = 0,5.
Kui WGS-i puhul on suhe eeldatavasti 2,10
Eeldatav suhe pole "2,10 WGS-i jaoks". Inimese jaoks on kogu genoom 2–2.10. Seda numbrit näete, kui joondate inimese genoomi šimpansiga või kui keskendute inimvariandide täpsele alamhulgale. Kuid teistes liikides võib oodatav ts / tv olla väga erinev. Samuti on see arv korrelatsioonis GC sisuga. Kõrgema GC-ga piirkondades või kodeerivates piirkondades, kus kipub olema ka kõrgem GC, saate kõrgema ts / tv. Osaliselt on seetõttu raske öelda, mida ts / tv-st täpselt oodatakse.
aga saan 3,00, mida see tähendab? Mis siis, kui saan 1,00?
Kui saate 3,00, on teie kõnekomplekt väga kallutatud. Kui saate 1,00, on teie kõnekomplekti veaprotsent kõrge. Oletame, et täpne ts / tv on $ \ beta $ ja jälgite ts / tv $ \ beta '\ le \ beta $, saate välja arvata valede kõnede murdosa (eeldades, et juhuslike vigade korral on ts / tv = 0,5) $ $ \ frac {3 (\ beta- \ beta ')} {(1+ \ beta') (2 \ beta-1)} $$ See on muidugi ligikaudne, kuna $ \ beta $ pole esiteks täpne ja kuna vead pole sageli juhuslikud, pole nende ts / tv tegelikult 0,5.
Kuidas see suhe täpselt valepositiivseid viitab? Liiga kõrge ==> kõrge valepositiivne protsent? Või liiga madal?
Liiga madal ==> kõrge valepositiivne protsent; liiga kõrge ==> kallutatud. Praktikas näete harva "liiga kõrget" ts / tv.