bl双性强迫侵犯h_国产在线观看人成激情视频_蜜芽188_被诱拐的少孩全彩啪啪漫画

go注釋r語言 GO注釋分析

R語言:clusterProfiler進行GO富集分析和Gene_ID轉換

ID轉換用到的是 bitr() 函數,bitr()的使用方法:

十年的貴南網站建設經驗,針對設計、前端、開發、售后、文案、推廣等六對一服務,響應快,48小時及時工作處理。成都全網營銷推廣的優勢是能夠根據用戶設備顯示端的尺寸不同,自動調整貴南建站的顯示方式,使網站能夠適用不同顯示終端,在瀏覽器中調整網站的寬度,無論在任何一種瀏覽器上瀏覽網站,都能展現優雅布局與設計,從而大程度地提升瀏覽體驗。創新互聯從事“貴南網站設計”,“貴南網站推廣”以來,每個客戶項目都認真落實執行。

org.Hs.eg.db包含有多種gene_name的類型

keytypes() :keytypes(x),查看注釋包中可以使用的類型

columns() :類似于keytypes(),針對org.Hs.eg.db兩個函數返回值一致

select() :select(x, keys, columns, keytype, ...) eg.

函數enrichGO()進行GO富集分析,enrichGO()的使用方法:

舉例:

GO注釋和富集分析

GO注釋是對某個特定基因功能的描述。每一條GO注釋由一個基因和相應的GO term組成。這些描述一起構成了當前的生物學認知的“快照”。關于基因功能的碎片化的認知可能建立在不同的等級之上,這就是為什么每條GO注釋總是會引用其基礎的證據。證據以GO“證據碼”的形式呈現,具體可能是一個已發表的文獻或者創建這條注釋的方法。

所有的GO注釋,最終都會被科學文獻支持。GO證據碼描述了證據并且粗略的反應了這條注釋與直接的實驗證據相距多遠,以及這條注釋是否被專家評估過。

2021-09-24 關于超幾何檢驗的一些理解

生物信息里面常見的就是KEGG?GO?等通路富集時候用到的?超幾何檢驗知識,為了便于理解?這里舉個例子:

目前有200個基因具有GO注釋,其中60個是GO04

我們得到20個差異基因,其中有11個是GO04,想問GO04這個通路是否在這20個基因中得到了富集??

(即公式中的,N=200,n=20,M=60,i=11);

我們先算抽取從200個基因里面抽20個基因,其中有11個基因具有GO04的概率:

即0.0093

下面為p值的計算公式:即 p-value=1-(p0+p1+p3+...+p10),可以看到如果括號里面的值越大,說明從200個基因里面抽20個,從抽到0個到抽10個基因是GO04通路里面的基因的概率很大,1-累加值就很小,說明我們的結果顯著富集(越不可能發生的事情,我們卻發生了)。

拓展R語言計算p值:

phyper(11-1,60,140,20,lower.tail = F)=0.0125還是蠻顯著的。

如果還不好理解,你可以試試極端的例子,

總共有10個基因,其中5個基因是GO04,我們現在得到5個差異基因,剛好這5個基因都是GO04(不言而喻這絕對很顯著了,p值理論上會趨近于0)

1-(p0+p1+p2+p3+p4) = 1-(1/252+25/252+100/252+100/252+25/252)=1/252=0.003968254很顯著!

R語言實現:

phyper(5-1,5,5,5,log.p = F,lower.tail=F)

GO(Gene Ontology)

Ontology 首先是出現于哲學領域的一個詞匯,后來廣泛用于計算機領域,發揮了很重要的作用,再后來這個概念被引入生物領域。

gene Ontology 是生物中Ontology中一個重要應用。go項目最初是由研究三種模式生物(果蠅、小鼠和酵母)基因組的研究者共同發起。是生物信息分析中很重要的一個方法

go是在生物領域應用非常廣,可以幫助生物學家對基因產物進行準確的定義(功能、位置),節省時間。

因為在最開始的時候,生物學家們更多是專注于自己研究的物種/課題,而且每個生物學家對功能等的定義是存在差異的,導致不同實驗室/物種不能實現直接的對接(比如A物種內的x基因的功能使用的是a這個詞匯進行注釋,而B物種內的x基因的功能卻使用的是與a同義的詞匯b進行注釋,這種情況計算機無法識別),就像講兩種語言的人,無法直接進行語言交流。這種情況導致的問題是,出現了一種阻礙,讓問題復雜化了。所以就有了Ontology在生物領域中的應用,實現“書同文”。

go定義了基因/基因產物的功能(通過術語)且定義了它們各自之間功能是怎樣聯系的(關系)。它組成了一個具有大量term的詞匯庫,并定義各種term之間的關系(is_a part_of R)。

GO通過三個方面的術語對基因/基因產物的功能進行描述:分子功能(molecular function) -由基因/基因產物行使的分子水平上的功能; 細胞組件(cellular component)-基因/基因產物產生功能時其在細胞結構上的位置;生物學過程(biological process)-在哪個生物學通路/生物過程發揮作用。

目前,GO 注釋主要有兩種方法:

(1)序列相似性比對(BLAST):例如blast2go(將blast結果轉化為GO注釋)

(2)結構域相似性比對(InterProScan)

blast2go的本地化教程:

在blast2go軟件正確安裝的情況下,使用blast2go進行go注釋,出現無法得到注釋結果的問題:

另外還有可能出錯的原因是,blast2go無法識別blast高的版本號,當使用高版本的blast的時候,直接將版本號給修改為低版本的就行了,例如(BLASTX 2.2.25+)

GO 的圖形是一個有向無環圖

網站標題:go注釋r語言 GO注釋分析
分享地址:http://vcdvsql.cn/article16/hhpigg.html

成都網站建設公司_創新互聯,為您提供響應式網站微信公眾號網站策劃營銷型網站建設做網站

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

外貿網站建設