我們輸入的數據包含 gene ID 和 vector(單樣本)部分,這里的 gene ID 是一個通用概念,可以是基因、轉錄本、酶或蛋白質。這里的 vector 可以是樣本的表達量、倍數變化, p-value, 組蛋白修飾數據等可測量的屬性。下面我們以一個 RNA-seq 差異分析后的數據為例,來學習 pathview 的用法。
創新互聯是專業的太和網站建設公司,太和接單;提供做網站、網站設計,網頁設計,網站設計,建網站,PHP網站建設等專業做網站服務;采用PHP框架,可快速的進行太和網站開發網頁制作和功能擴展;專業做搜索引擎喜愛的網站,專業的做網站團隊,希望更多企業前來合作!
在 KEGG PATHWAY Database 查詢,例如查詢小鼠的"Cell Cycle"這條通路:
得到通路 ID 為"04110",物種為"mmu"
我們通過指定 gene.data 和 pathway.id 來觀察我們數據里的基因在信號通路“Pathways in cancer”上的表達變化:
相比于原始的 KEGG 圖,我們可以使用 graphviz 產生一個新的布局,并且輸出 PDF 格式的文件:
以下是輸出結果圖
如果我們想要運行的更快一點,并且不介意輸出圖片的大小,我們可以分圖層,用 same.layer = F 將節點顏色和標簽添加到另一個圖層中,并且原來的 KEGG 基因標簽會變成官方的 gene symbols :
在此基礎上,修改 kegg.native = FALSE ,我們就可以得到一個主圖與圖例分成兩個頁面的 PDF 文件
在原始的 KEGG 視圖中,一個基因節點可能代表具有相似或者冗余功能的基因/蛋白質,我們可以將這種包含多個基因的節點拆分成獨立的節點,這樣可以更好的從基因層面而不是節點層面來查看數據。同時也可以通過匯總基因數據來可視化節點數據:
為了畫面有更好的清晰度和可讀性,默認不分裂節點,也不單獨標記每個成員基因。
代謝途徑中,除了基因節點還有化合物節點,我們可以嘗試利用代謝途徑( Propanoate metabolism)整合基因數據和化合物數據。這里的化合物數據包括代謝物、藥物,對它們的測量和它們的屬性。在這里我們仍然使用之前 RNA-seq 差異分析的數據作為 gene data,然后,我們生成模擬化合物或代謝組數據,并加載適當的化合物 ID 類型以進行演示:
結果如下
pathview 可以集成并將多個樣本或狀態繪制成一個圖,我們可以使用多個重復樣本模擬化合物數據:
結果如下,可以看到基因節點和化合物節點被分成多份,對應不同的樣本:
我們可以根據將化合物數據分為絕對值大于 5 和小于 5 兩類,構成一組離散型數據:
結果如下:
Pathview 包中的主函數是 pathview() ,有著各種參數,是我們用到最多的函數。在這篇文章中,我們介紹了 pathview()的比較常見的用法,包括包安裝,數據準備,以及其他有用的特性。我們也可以使用 pathxiew 的網頁版,地址是 。此外,Pathview 在數據整合方面有很強大的功能,包含 4800 個物種,能處理的數據屬性和格式包括 連續/離散數據、矩陣/矢量、單個/多個樣本數據 ,包中還具有強大的 ID 轉換功能,這些都值得我們進一步探索。
生活很好,有你更好
查看GOplot內示例數據的格式,對自己的數據做處理
觀察結論:
觀察自己的兩個數據表:
table.legend 設置為T時會顯示表格
本圖中表格和圖例是出圖后剪切拼合而成,沒有用R中的拼圖包
ID轉換用到的是 bitr() 函數,bitr()的使用方法:
org.Hs.eg.db包含有多種gene_name的類型
keytypes() :keytypes(x),查看注釋包中可以使用的類型
columns() :類似于keytypes(),針對org.Hs.eg.db兩個函數返回值一致
select() :select(x, keys, columns, keytype, ...) eg.
函數enrichGO()進行GO富集分析,enrichGO()的使用方法:
舉例:
前面我給大家詳細介紹過
?GO簡介及GO富集結果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風格展示結果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發現GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經過我的認真研究,發現跟R版本有關。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關的函數拿出來認真的研究了一下,終于發現的癥結所在。
dotplot這個函數,多了個 label_format 參數
我們來看看這個參數究竟是干什么用的,看看參數說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數默認值是30,當標簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調節一下這個參數,把他設置成100,讓我們的標簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復原來的容貌。
關于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
本文名稱:r語言go富集圖 r語言faithful數據集
分享路徑:http://vcdvsql.cn/article6/ddcciig.html
成都網站建設公司_創新互聯,為您提供外貿網站建設、營銷型網站建設、面包屑導航、建站公司、虛擬主機、App開發
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯