ID轉(zhuǎn)換用到的是 bitr() 函數(shù),bitr()的使用方法:
創(chuàng)新互聯(lián)公司2013年成立,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目成都做網(wǎng)站、網(wǎng)站建設(shè)網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元魯?shù)樽鼍W(wǎng)站,已為上家服務(wù),為魯?shù)楦鞯仄髽I(yè)和個(gè)人服務(wù),聯(lián)系電話:18982081108
org.Hs.eg.db包含有多種gene_name的類型
keytypes() :keytypes(x),查看注釋包中可以使用的類型
columns() :類似于keytypes(),針對(duì)org.Hs.eg.db兩個(gè)函數(shù)返回值一致
select() :select(x, keys, columns, keytype, ...) eg.
函數(shù)enrichGO()進(jìn)行GO富集分析,enrichGO()的使用方法:
舉例:
Ontology 首先是出現(xiàn)于哲學(xué)領(lǐng)域的一個(gè)詞匯,后來(lái)廣泛用于計(jì)算機(jī)領(lǐng)域,發(fā)揮了很重要的作用,再后來(lái)這個(gè)概念被引入生物領(lǐng)域。
gene Ontology 是生物中Ontology中一個(gè)重要應(yīng)用。go項(xiàng)目最初是由研究三種模式生物(果蠅、小鼠和酵母)基因組的研究者共同發(fā)起。是生物信息分析中很重要的一個(gè)方法
go是在生物領(lǐng)域應(yīng)用非常廣,可以幫助生物學(xué)家對(duì)基因產(chǎn)物進(jìn)行準(zhǔn)確的定義(功能、位置),節(jié)省時(shí)間。
因?yàn)樵谧铋_始的時(shí)候,生物學(xué)家們更多是專注于自己研究的物種/課題,而且每個(gè)生物學(xué)家對(duì)功能等的定義是存在差異的,導(dǎo)致不同實(shí)驗(yàn)室/物種不能實(shí)現(xiàn)直接的對(duì)接(比如A物種內(nèi)的x基因的功能使用的是a這個(gè)詞匯進(jìn)行注釋,而B物種內(nèi)的x基因的功能卻使用的是與a同義的詞匯b進(jìn)行注釋,這種情況計(jì)算機(jī)無(wú)法識(shí)別),就像講兩種語(yǔ)言的人,無(wú)法直接進(jìn)行語(yǔ)言交流。這種情況導(dǎo)致的問(wèn)題是,出現(xiàn)了一種阻礙,讓問(wèn)題復(fù)雜化了。所以就有了Ontology在生物領(lǐng)域中的應(yīng)用,實(shí)現(xiàn)“書同文”。
go定義了基因/基因產(chǎn)物的功能(通過(guò)術(shù)語(yǔ))且定義了它們各自之間功能是怎樣聯(lián)系的(關(guān)系)。它組成了一個(gè)具有大量term的詞匯庫(kù),并定義各種term之間的關(guān)系(is_a part_of R)。
GO通過(guò)三個(gè)方面的術(shù)語(yǔ)對(duì)基因/基因產(chǎn)物的功能進(jìn)行描述:分子功能(molecular function) -由基因/基因產(chǎn)物行使的分子水平上的功能; 細(xì)胞組件(cellular component)-基因/基因產(chǎn)物產(chǎn)生功能時(shí)其在細(xì)胞結(jié)構(gòu)上的位置;生物學(xué)過(guò)程(biological process)-在哪個(gè)生物學(xué)通路/生物過(guò)程發(fā)揮作用。
目前,GO 注釋主要有兩種方法:
(1)序列相似性比對(duì)(BLAST):例如blast2go(將blast結(jié)果轉(zhuǎn)化為GO注釋)
(2)結(jié)構(gòu)域相似性比對(duì)(InterProScan)
blast2go的本地化教程:
在blast2go軟件正確安裝的情況下,使用blast2go進(jìn)行g(shù)o注釋,出現(xiàn)無(wú)法得到注釋結(jié)果的問(wèn)題:
另外還有可能出錯(cuò)的原因是,blast2go無(wú)法識(shí)別blast高的版本號(hào),當(dāng)使用高版本的blast的時(shí)候,直接將版本號(hào)給修改為低版本的就行了,例如(BLASTX 2.2.25+)
GO 的圖形是一個(gè)有向無(wú)環(huán)圖
轉(zhuǎn)錄組是一類讓人既愛又恨的項(xiàng)目,實(shí)驗(yàn)門檻低,卻是文章泛濫的重災(zāi)區(qū),總有人問(wèn)我,現(xiàn)在轉(zhuǎn)錄組還能發(fā)文章嗎?下面我就借一篇2020年5月4日發(fā)表在BMC Genomics上題為:Transcriptome analysis reveals rapid defence responses in wheat induced by phytotoxic aphid Schizaphis graminum feeding 的文章,詳細(xì)地論述下2020年轉(zhuǎn)錄組文章到底有多難發(fā)?怎么發(fā)?下面我們先看下這篇文章具體內(nèi)容: 實(shí)驗(yàn)簡(jiǎn)介: 文章研究的是小麥幼苗在麥二叉蚜采食后的快速防衛(wèi)反應(yīng),分別于采食2、6、12、24、48 h后取幼苗葉片(3次生物學(xué)重復(fù)),進(jìn)行轉(zhuǎn)錄組測(cè)序、葉綠素測(cè)定以及H2O2 積累測(cè)定以及NADPH抑制劑處理進(jìn)一步探究小麥在咬食后氧迸發(fā)防御機(jī)制。 實(shí)驗(yàn)結(jié)果:
1.?麥二叉蚜采食后小麥轉(zhuǎn)錄組分析 這部分結(jié)果展示比較套路,主要是通過(guò)PCA分析看了下樣品相關(guān)性及處理效應(yīng),介紹了一下差異基因總體情況。如下圖:
2. 差異基因GO分析 作者按上調(diào)/下調(diào)基因集分別進(jìn)行GO注釋,并按時(shí)間點(diǎn)分別論述上調(diào)/下調(diào)基因集富集情況,如下圖:
3.?麥二叉蚜采食后小麥葉片葉綠素含量變化 從差異基因GO分析可以看出,蚜蟲采食可以負(fù)向調(diào)控小麥的光合作用過(guò)程、光捕獲和光系統(tǒng)相關(guān)基因,所以作者又測(cè)定了采食后小麥葉片葉綠素含量變化,如下圖:
4.?麥二叉蚜采食后小麥葉片中水楊酸、茉莉酸相關(guān)防御途徑的基因表達(dá) 參與SA生物合成的苯丙氨酸解氨酶(PAL)基因在不同時(shí)間點(diǎn)均顯著上調(diào),但表達(dá)水平隨采食時(shí)間的增加而逐漸降低;茉莉酸代謝途徑中三種脂氧合酶(LOX)基因均顯著上調(diào);受MAPKs調(diào)控的WRKY轉(zhuǎn)錄因子也顯示上調(diào),如下圖:
5.?二叉蚜采食后小麥葉片中過(guò)氧化氫(H2O2)積累和抗氧化酶活性的變化 蚜蟲采食明顯上調(diào)活性氧清除基因的表達(dá),進(jìn)一步通過(guò)3,3 ' -二氨基聯(lián)苯胺(DAB)對(duì)小麥小麥葉片進(jìn)行細(xì)胞學(xué)染色,采食2h后就出現(xiàn)H2O2積累,并且隨采食時(shí)間的延長(zhǎng),斑點(diǎn)數(shù)量和大小逐漸增加,如下圖:
6. NADPH氧化酶抑制對(duì)小麥葉片H2O2積累和防御反應(yīng)的影響 NADPH氧化酶抑制劑二苯碘銨(DPI)不僅能明顯抑制由采食引起的氧迸發(fā),并且對(duì)小麥葉片防御應(yīng)答基因表達(dá)水平也有明顯的下調(diào)作用。
以上就是該篇文章全部結(jié)果,回頭來(lái)看,這個(gè)實(shí)驗(yàn)設(shè)計(jì)并不復(fù)雜,內(nèi)容也不是過(guò)多,為啥人家能發(fā)表而你卻被拒稿呢?要知道,就這個(gè)2區(qū)3.5分影響因子的BMC Genomics ,也是很多人渴望而不可得的存在。
2020年,轉(zhuǎn)錄組類文章到底有多難發(fā)?從這篇文章我們可以看到,文章并沒(méi)有你想像中的難發(fā),我試著從中提煉以下幾點(diǎn),希望對(duì)您有所借鑒。
1. 實(shí)驗(yàn)設(shè)計(jì)相對(duì)合理,層級(jí)遞進(jìn),取樣點(diǎn)與植物防衛(wèi)三級(jí)級(jí)聯(lián)反應(yīng)基本對(duì)應(yīng),后續(xù)分析論述層次較為分明。
2. 轉(zhuǎn)錄組僅是的實(shí)驗(yàn)中的一部分,套路式的羅列結(jié)果的時(shí)代已沒(méi)過(guò)去了,將轉(zhuǎn)錄組與其他指標(biāo)融合在一起,就像本文中,除了轉(zhuǎn)錄組,作者還進(jìn)一步進(jìn)行了生理指標(biāo)測(cè)定,如葉綠素含量、氧迸發(fā)等,基因關(guān)聯(lián)性狀,使結(jié)果更有說(shuō)服力。
3. 轉(zhuǎn)錄組數(shù)據(jù)介紹切忌空泛,要結(jié)合其他生理生化指標(biāo),提煉出某些相關(guān)基因加以展示,如本文中葉綠素含量與表達(dá)下調(diào)的光捕獲、光和作用相關(guān)的基因;H2O2積累和抗氧化酶活性的變化等。
4. 論文精華都在討論部分,多引用他人數(shù)據(jù)佐證自己的結(jié)果,能做到旁征博引,論文一般都錯(cuò)不了!精讀文獻(xiàn)原文,請(qǐng)點(diǎn)擊文末“閱讀原文” 直達(dá)。
2020年,轉(zhuǎn)錄組類文章有多難發(fā)?其實(shí)難的是你不肯轉(zhuǎn)變觀念,時(shí)代不同了,老套路也就過(guò)時(shí)了;很多老師目前面對(duì)的難題不是手里沒(méi)數(shù)據(jù),也不是不會(huì)寫論文,而是數(shù)據(jù)看不明白,分析便無(wú)從下手,這個(gè)梗不破,怎么發(fā)文章?!我給大家推薦一部 《轉(zhuǎn)錄組分析結(jié)果解讀》 視頻教程 ,輕松解決您看不懂轉(zhuǎn)錄組結(jié)果數(shù)據(jù)的難題。
;shareId=1031484705
更多技能學(xué)習(xí)鏈接:
;shareId=1031484705
更多生物信息課程:
1. 文章越來(lái)越難發(fā)?是你沒(méi)發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡(jiǎn)單快速,學(xué)習(xí)鏈接: 基因家族分析實(shí)操課程 、 基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件,學(xué)習(xí)鏈接: 轉(zhuǎn)錄組(有參)結(jié)果解讀 ; 轉(zhuǎn)錄組(無(wú)參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次,學(xué)習(xí)鏈接: WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接: 轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘 、 轉(zhuǎn)錄組文獻(xiàn)解讀
5. 微生物16S/ITS/18S分析原理及結(jié)果解讀 、 OTU網(wǎng)絡(luò)圖繪制 、 cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接: linux系統(tǒng)使用 、 perl入門到精通 、 perl語(yǔ)言高級(jí) 、 R語(yǔ)言畫圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接: TCGA-差異基因分析 、 GEO芯片數(shù)據(jù)挖掘 、 GSEA富集分析課程 、 TCGA臨床數(shù)據(jù)生存分析 、 TCGA-轉(zhuǎn)錄因子分析 、 TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接: 二代測(cè)序轉(zhuǎn)錄組數(shù)據(jù)自主分析 、 NCBI數(shù)據(jù)上傳 、 二代測(cè)序數(shù)據(jù)解讀 。
看注釋前的字母。
R語(yǔ)言初學(xué)指南可在腳本中加入注釋。在腳本中,任何以“#”(sharp/numbersymbol)開頭的命令行都會(huì)被R忽略。
同樣,若“#”出現(xiàn)在某行的中間,則該行中“#”后面的語(yǔ)句都會(huì)被忽略。可利用這一特性對(duì)腳本添加注釋,以便用戶或他人日后查閱。
例如,作者每次查看前一天編寫的腳本時(shí),都要重新梳理并回憶每條腳本語(yǔ)句的作用。
對(duì)基因的描述一般從三個(gè)層面進(jìn)行:
這三個(gè)層面具體是指:
得到GO注釋
做GO分析的思路:
比如,在疾病研究的時(shí)候,進(jìn)行藥物治療之后某些基因的表達(dá)量明顯的發(fā)生了變化,拿這些基因去做GO分析發(fā)現(xiàn)在Biological process過(guò)程當(dāng)中集中在RNA修飾上,然后在此基礎(chǔ)上繼續(xù)進(jìn)行挖掘。這個(gè)例子就是想啟示大家拿到差異表達(dá)基因DEG只是一個(gè)開始,接下來(lái)就應(yīng)該去做GO注釋,之后需要進(jìn)行一個(gè)分析看這些注釋主要集中在哪個(gè)地方。假如我們有100個(gè)差異表達(dá)基因其中有99個(gè)都集中在細(xì)胞核里,那我們通過(guò)GO分析就得到了一個(gè)顯著的分布。
GO富集分析原理:
有一個(gè)term注釋了100個(gè)差異表達(dá)基因參與了哪個(gè)過(guò)程,注釋完之后(模式生物都有現(xiàn)成的注釋包,不用我們自己注釋),計(jì)算相對(duì)于背景它是否顯著集中在某條通路、某一個(gè)細(xì)胞學(xué)定位、某一種生物學(xué)功能。
clusterProfiler是一個(gè)功能強(qiáng)大的R包,同時(shí)支持GO和KEGG的富集分析,而且可視化功能非常的優(yōu)秀,本章主要介紹利用這個(gè)R包來(lái)進(jìn)行Gene Ontology的富集分析。
進(jìn)行GO分析時(shí),需要考慮的一個(gè)基礎(chǔ)因素就是基因的GO注釋信息從何處獲取。Bioconductor上提供了以下19個(gè)物種的Org類型的包,包含了這些物種的GO注釋信息
對(duì)于以上19個(gè)物種,只需要安裝對(duì)應(yīng)的org包,clusterProfile就會(huì)自動(dòng)從中獲取GO注釋信息,我們只需要差異基因的列表就可以了,使用起來(lái)非常方便。
1.1 準(zhǔn)備輸入數(shù)據(jù)
待分析的數(shù)據(jù)就是一串基因名稱了,可以是ensembl id、entrze id或者symbol id等類型都可以。把基因名稱以一列的形式排開,放在一個(gè)文本文件中(例如命名“gene.txt”)。Excel中查看,就是如下示例這種樣式。
1.3 GO富集分析
加載了注釋庫(kù)之后,讀取基因列表文件,并使用clusterProfiler的內(nèi)部函數(shù)enrichGO()即可完成GO富集分析。
讀取基因列表文件,并使用clusterProfiler的內(nèi)部函數(shù)enrichKEGG()即可完成KEGG富集分析。
此外,clusterProfiler中也額外提供了一系列的可視化方案用于展示本次富集分析結(jié)果,具有極大的便利。
參考:
;utm_medium=timeline
分享題目:r語(yǔ)言進(jìn)行g(shù)o注釋 go語(yǔ)言 注解
URL地址:http://vcdvsql.cn/article34/hpgipe.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號(hào)、面包屑導(dǎo)航、品牌網(wǎng)站制作、企業(yè)網(wǎng)站制作、網(wǎng)站排名、品牌網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
移動(dòng)網(wǎng)站建設(shè)知識(shí)