Küsimus:
Kokku loeb joondamine bam-faili iga viite järgi
CM3
2018-10-30 19:35:56 UTC
view on stackexchange narkive permalink

Mul on kaks PCR-amplikonit, mis on multipleksitud ja järjestatud nanopoorse minioni abil.

Olen joondanud minimaalse faili 2 abil fastq-i loendid võrdlusfailiga, mis sisaldab mõlemat amplikonjärjestust, ja loonud minu käsutuses oleva bam-faili vaadatud IGV abil.

Otsin viisi, kuidas luua lihtsat kokkuvõtlikku statistikat.

Kas on võimalik eraldada iga amplikoniga joondatud kiirete lugemiste koguarv viide bam-failist?

Kolm vastused:
Ian Sudbery
2018-10-30 23:00:03 UTC
view on stackexchange narkive permalink

Kiire viis iga viite joondamiste arvu saamiseks on

  samtools idxstats my_bam.bam  

Iga viite lugemiste arv on veerg 3. Kuigi, nagu on välja toodud, annab see teile joondamiste koguarvu viite kohta, mitte lugemiste koguarvu (iga lugemine võib põhjustada rohkem kui ühe joonduse). See tähendab, et ma kipun seda meile tegema, kuna üldiselt olen täpse arvu asemel ligikaudse lähenduse järel.

Teoreetiliselt peaks iga lugemise jaoks peamiseks märkima ainult ühe joonduse, nii et järgmine peaks teile vajaliku andma kiiresti ja vähese mälukasutuse korral:

  samtools view -bF 2304 my_bam.bam > primary_only.bamsamtools register primary_only.bamsamtools idxstats primary_only.bam  
conchoecia
2018-10-30 20:08:17 UTC
view on stackexchange narkive permalink

See allolev ühe liini töötab pika lugemise korral paremini kui samtools flagstat , kuna see loeb iga loetu esmast joondust ja samtools flagstat ei tundu olevat arvutage mõni statistika pikkade lugemiste kohta. Ma pole kunagi näinud samtools flagstat väljundstatistikat viite alusel, kuid olen uudishimulik, kui jah!

See vastus filtreerib teie lugude sekundaarsed ja täiendavad joondused ( -F 2304 ), mis on mõlema amplikoni võrdlusega mõnevõrra joondatud ja säilitavad lihtsalt parima See võib anda täpsema ettekujutuse sellest, kui palju igast amplikonist loetakse teeki.

  samtools view -F 2304 myfile.bam | awk -F  $ '\ t' '{a [$ 1, $ 3] ++} LÕPP {for (i in a) {split (i, sep, SUBSEP); printige sep [1], sep [2], a [i]}} '| uniq | awk '{print ($  2)}' | uniq -c | sort -k1 -nr  

on sellest kohandatud.

Ammar Sabir Cheema
2018-10-30 19:57:16 UTC
view on stackexchange narkive permalink

Seda saab teha, kasutades

  samtools flagstat your_bam_file  
Ma arvan, et flagstat loeb bam-failis joonduste arvu.


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 4.0-litsentsi eest, mille all seda levitatakse.
Loading...