Valem k-mer katvuse jaoks

Küsimus:

user44697

2017-07-26 18:35:43 UTC

view on stackexchange narkive permalink

Olgu $ C $ baaskatvus, $ R $ on lugemiste pikkus ja $ K $ on $ k $ -mer pikkus. Siis saab $ k $ -meri katvuse $ C_k $ arvutada järgmiselt: $ C_k = C \ cdot (R - K + 1) / R $.

Kas keegi võiks selgitada, miks see võrrand kehtib (I ' Olen enamasti segaduses, miks see jagatakse $ R $-ga)?

Allikas: Velveti käsiraamatu jaotis 5.1

Kaks vastused:

Kamil S Jaron

2017-07-27 15:02:09 UTC

view on stackexchange narkive permalink

Olin ikka veel vastustest hämmingus, nii et proovisin kõigi sammudega arvutada. Võtan selle definitsiooni "$ C_k $ on k-mer sisaldavate lugemiste arv." ja vastav katvuse määratlus ($ C $): "$ C $ on alust hõlmavate lugemiste arv".

Katvus on $ C = \ frac {T \ cdot R} {L} $, kus $ T $ on lugemiste koguarv, $ R $ on loetud pikkus ja $ L $ on genoomi pikkus. Arvestades $ C_k $ definitsiooni, on $ C_k = \ frac {T (R - K + 1)} {L-K + 1} $, kus $ R - K + 1 $ on vaid km-de arv lugemisega ja $ L-K + 1 $ on kilomeetrite arv genoomis. Seejärel

$$ C_k = \ frac {T (R - K + 1)} {L-K + 1} = \ frac {T (R - K + 1)} {L-K + 1} \ cdot \ frac {R} {R} = \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L - K + 1} $$

kuna $ L >> K $, saame ligikaudseks väärtuseks $ L - K + 1 \ umbes L $, siis vähendame avaldise väärtuseks

$$ \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L} = \ frac {R - K + 1} {R} \ cdot C $$

mis on valemi $ C_k $ jaoks.

Devon Ryan

2017-07-27 01:45:29 UTC

view on stackexchange narkive permalink

$ C_k $ on määratletud kui k-mer sisaldavate lugemiste arv. K-mer sisaldamiseks kättesaadava lugemise osa on $ (R-K + 1) / R $, mis on k-meride arv loendis jagatuna selle pikkusega. Sel ajal on nukleotiidide katvus ($ C $) k-meride eeldatav katvus.

ⓘ

See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.

about - legalese