Küsimus:
Kuidas lugeda ja tõlgendada geeniekspressiooni kvantifitseerimise faili?
0x90
2017-06-08 07:25:46 UTC
view on stackexchange narkive permalink

Mul on TCGA geeniekspressiooni kvantifitseerimisfail, mis sisaldab järgmisi ridu:

  ENSG00000242268.2 591.041000514ENSG00000270112.3 0.0ENSG00000167578.15 62780.6543066ENSG00000273842.1 0.0ENSG00000078237.5 36230.832883ENSG00000146083.10 189653.152706ENSG00000225275.4 0.0ENSG00000158486.12 420.761140072ENSG00000198242.12 2914738.3675ENSG00000259883.1 1632.83700531ENSG00000231981.3 0.0ENSG00000269475.2 0.0ENSG00000201788.1 0.0ENSG00000134108.11 925529.547944ENSG00000263089.1 2646.63769677ENSG00000172137.17 23162.6989867ENSG00000167700 .7 291192.25157  
  1. Mis on .number , mis lisatakse geenile nt. .2 ENSG00000242268.2

  2. miks pole kvantifitseeritud väärtus täisarv; mida tähendab 591.041000514 ?

Juhul kui keegi tahab rohkem teavet geeni LINC02082 kohta.

üks vastus:
Daniel Standage
2017-06-08 08:05:40 UTC
view on stackexchange narkive permalink
  1. Esimene veerg sisaldab Ensembli geenitunnuseid ja järelliide on versiooni number, mida saab kasutada geenimärkuste muutuste jälgimiseks ajas. Dokumentatsioonist Ensembl Stable IDs:

    Ansamblis Ensembl kasutatakse stabiilsete ID-de süsteemi, millel on liigi teaduslikul nimel ja funktsioonitüüp, millele järgneb arvude rida ja versioon nt ENSG00000139618.1. Versiooni võidakse välja jätta.

  2. Esitatud esimese lingi järgimine viib lehele, kus on üksikasjad faili 2edcaaa7 kohta -63b4-40b4-abbe-5d7a84012e60.FPKM-UQ.txt.gz . Esimene asi, mis mulle selle failinime puhul silma jäi, oli FPKM ehk "fragmendid eksoni kilobaasi kohta miljoni lugemise kohta", mis on tavaliselt kasutatav RNA ekspressiooni ühik. Kuna need pole toored lugemised, pole lootust, et need väärtused peaksid olema täisarvud.

    Parim selgitus, mida FPKM-i kohta olen näinud, pärineb Harold Pimenteli kirjutatud blogipostitusest kuulsusest kallisto ja sleuth. Blogipostitusest:

    FPKM-i tõlgendus on järgmine: kui peaksite selle RNA kogumi uuesti järjestama, näete iga tuhande kohta FPKM_i fragmente funktsioonide alused iga järjestatud N / 10 ^ 6 fragmendi jaoks. Selle mugavamaks muutmiseks on põhimõtteliselt lihtsalt fragmentide määr baasi kohta korrutatud suure arvuga (proportsionaalne järjestatud fragmentide arvuga).


Üldisemalt, isegi kui FPKM pole kasutatud väljendite arvukuse ühik, ei anna enamik kvantifitseerimismeetodeid ja seonduvaid väljendusühikuid täisarvuprognoose.

Sellised tööriistad nagu DESeq2 suudavad genereerida muud avaldisstatistikat, mis on FPKM-iga sarnane, kuid mitte sama. Ma ei ole kindel, kas on mõtet sellele konkreetsele küsimusele vastata (st FPKM-i normaliseerimise tõttu) või üldisemal juhul, kus ma ütleksin, et väärtused on mitmesuguste erinevate normaliseerimisprotseduuride (nt parandus) tõttu ujukoma. ärakirja pikkuse, järjestuse sügavuse, lasumüra, kovariaatide segamise jaoks).


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...