Olin ikka veel vastustest hämmingus, nii et proovisin kõigi sammudega arvutada. Võtan selle definitsiooni "$ C_k $ on k-mer sisaldavate lugemiste arv." ja vastav katvuse määratlus ($ C $): "$ C $ on alust hõlmavate lugemiste arv".
Katvus on $ C = \ frac {T \ cdot R} {L} $, kus $ T $ on lugemiste koguarv, $ R $ on loetud pikkus ja $ L $ on genoomi pikkus. Arvestades $ C_k $ definitsiooni, on $ C_k = \ frac {T (R - K + 1)} {L-K + 1} $, kus $ R - K + 1 $ on vaid km-de arv lugemisega ja $ L-K + 1 $ on kilomeetrite arv genoomis. Seejärel
$$ C_k = \ frac {T (R - K + 1)} {L-K + 1} = \ frac {T (R - K + 1)} {L-K + 1} \ cdot \ frac {R} {R} = \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L - K + 1} $$
kuna $ L >> K $, saame ligikaudseks väärtuseks $ L - K + 1 \ umbes L $, siis vähendame avaldise väärtuseks
$$ \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L} = \ frac {R - K + 1} {R} \ cdot C $$
mis on valemi $ C_k $ jaoks.