Küsimus:
Väga heterosügootne loeb kaardistamist
cmdoret
2019-01-11 03:18:05 UTC
view on stackexchange narkive permalink

Mul on lühike (67 aluspaari) Hi-C lugemine väga heterosügootsest organismist (~ 15% haplotüübi vaheliste SNP lahknemiste vahel) ja mul on mõlemad võrdlushaplotüübid.

Tahtsin proovida ja võrrelda erinevaid haplotüüpe tarkvara Hi-C lugemiseks, kasutades neid loendeid võrdlusuuringute andmekogumina. Lugude kaardistamisel igale haplotüübile saan hea kaardistamise statistika. Kui ma kaardistan lugemid ühele haplotüübile, kus kõik heterosügootsed SNP-d on maskeeritud (N-desse), saan kaardistamise määra väga kehvaks.

Ma tahaksin, et saaksin kaardistada lugemisi, kui tegelikud haplotüübid pole teada. (viide on segu haplotüüpidest).

Ma kasutan lugude kaardistamiseks sr eelseadistusega minimap2. Proovisin vähendada mittevastavuse trahvi (-B) 1-ni ja suurendada -score-N väärtust, kuid sellel polnud mingit mõju.

Nagu on lisatud IGV ekraanipildil, langeb katvus 0-ni, kui SNP tihedus suureneb. enter image description here Kas on võimalik kaardistada nii kõrge heterosügootsusega lugesid ühe (maskeeritud) viite abil? Kas peaksin kasutama mõnda muud tööriista?

Kas oskaksite oma lugusid natuke rohkem kirjeldada? DNA / mRNA? SE / PE? 50bp / 100bp / jne? Kui peaksin aimama, ütleksin, et teil on probleeme lugemite õigeks külvamiseks joondamiseks. Samuti võib olla kasulik teada, miks peate maskeeritud lugemid kaardistama, kui eraldi kaardistamine töötab hästi.
Aitäh tagasiside eest ! Uuendasin küsimust, et lisada rohkem tausta ja teavet.
Lihtsalt selle kinnitamiseks, et see on heterosügootne ja pole eriti korduv?
Jah, lihtsalt väga heterosügootne, see on hübriidpärm
Selle heterosügootsuse tasemega saate lihtsalt kõik kokku panna ja haplotüübid eraldada. Ma pole kindel, kas see on optimaalne võrdlusuuringute andmekogum.
Teil on õigus, ma kasutan selleks teist andmekogumit, kuid ma olin siiski uudishimulik selle teostatavuse osas :)
üks vastus:
Lucas Boatwright
2019-02-19 20:15:12 UTC
view on stackexchange narkive permalink

Ma usun, et teil on võimalik oma lugemid kaardistada, kuid ma ei tea, kuidas minimap2 abil seda teha.

Soovitan käivitada gsnap, mis on SNP-tolerantsem ja pakub mitmeid parameetreid, mis tõenäoliselt aitavad.

Näiteks usun, et enamik joondajaid käsitleb 'N' tähemärke mittevastavusena joondamisel. GSNAP-il on selle arvestamiseks parameetrid.

  --query-unk-mismatch = INT Kas lugeda päringus tundmatuid (N) tähemärke mittevastavaks (0 = ei (vaikimisi), 1 = jah) - genoom-unk -mismatch = INT Kas loendada genoomis olevad tundmatud (N) tähemärgid mittevastavaks (0 = ei, 1 = jah (vaikimisi))  

Sellel on ka mittevastavuse parameeter, mis on sarnane selline, mida kirjeldasite minimap2 jaoks.

  -m, --max-mismatches = FLOAT Suurim lubatud mittevastavuste arv  

Proovige käivitada 'genome-unk -mismatch 'parameeter ülal (koos maskeeritud viitega). See võib olla teie parim valik. On ka muid parameetreid, mis võivad aidata, kuid see peaks olema hea algus.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 4.0-litsentsi eest, mille all seda levitatakse.
Loading...