Väga heterosügootne loeb kaardistamist

cmdoret

2019-01-11 03:18:05 UTC

view on stackexchange narkive permalink

Mul on lühike (67 aluspaari) Hi-C lugemine väga heterosügootsest organismist (~ 15% haplotüübi vaheliste SNP lahknemiste vahel) ja mul on mõlemad võrdlushaplotüübid.

Tahtsin proovida ja võrrelda erinevaid haplotüüpe tarkvara Hi-C lugemiseks, kasutades neid loendeid võrdlusuuringute andmekogumina. Lugude kaardistamisel igale haplotüübile saan hea kaardistamise statistika. Kui ma kaardistan lugemid ühele haplotüübile, kus kõik heterosügootsed SNP-d on maskeeritud (N-desse), saan kaardistamise määra väga kehvaks.

Ma tahaksin, et saaksin kaardistada lugemisi, kui tegelikud haplotüübid pole teada. (viide on segu haplotüüpidest).

Ma kasutan lugude kaardistamiseks sr eelseadistusega minimap2. Proovisin vähendada mittevastavuse trahvi (-B) 1-ni ja suurendada -score-N väärtust, kuid sellel polnud mingit mõju.

Nagu on lisatud IGV ekraanipildil, langeb katvus 0-ni, kui SNP tihedus suureneb. Kas on võimalik kaardistada nii kõrge heterosügootsusega lugesid ühe (maskeeritud) viite abil? Kas peaksin kasutama mõnda muud tööriista?

Kas oskaksite oma lugusid natuke rohkem kirjeldada? DNA / mRNA? SE / PE? 50bp / 100bp / jne? Kui peaksin aimama, ütleksin, et teil on probleeme lugemite õigeks külvamiseks joondamiseks. Samuti võib olla kasulik teada, miks peate maskeeritud lugemid kaardistama, kui eraldi kaardistamine töötab hästi.

Aitäh tagasiside eest ! Uuendasin küsimust, et lisada rohkem tausta ja teavet.

Lihtsalt selle kinnitamiseks, et see on heterosügootne ja pole eriti korduv?

Jah, lihtsalt väga heterosügootne, see on hübriidpärm

Selle heterosügootsuse tasemega saate lihtsalt kõik kokku panna ja haplotüübid eraldada. Ma pole kindel, kas see on optimaalne võrdlusuuringute andmekogum.

Teil on õigus, ma kasutan selleks teist andmekogumit, kuid ma olin siiski uudishimulik selle teostatavuse osas :)