Mul on lühike (67 aluspaari) Hi-C lugemine väga heterosügootsest organismist (~ 15% haplotüübi vaheliste SNP lahknemiste vahel) ja mul on mõlemad võrdlushaplotüübid.
Tahtsin proovida ja võrrelda erinevaid haplotüüpe tarkvara Hi-C lugemiseks, kasutades neid loendeid võrdlusuuringute andmekogumina. Lugude kaardistamisel igale haplotüübile saan hea kaardistamise statistika. Kui ma kaardistan lugemid ühele haplotüübile, kus kõik heterosügootsed SNP-d on maskeeritud (N-desse), saan kaardistamise määra väga kehvaks.
Ma tahaksin, et saaksin kaardistada lugemisi, kui tegelikud haplotüübid pole teada. (viide on segu haplotüüpidest).
Ma kasutan lugude kaardistamiseks sr eelseadistusega minimap2. Proovisin vähendada mittevastavuse trahvi (-B) 1-ni ja suurendada -score-N väärtust, kuid sellel polnud mingit mõju.
Nagu on lisatud IGV ekraanipildil, langeb katvus 0-ni, kui SNP tihedus suureneb. Kas on võimalik kaardistada nii kõrge heterosügootsusega lugesid ühe (maskeeritud) viite abil? Kas peaksin kasutama mõnda muud tööriista?