ID轉(zhuǎn)換用到的是 bitr() 函數(shù),bitr()的使用方法:
創(chuàng)新互聯(lián)公司是專業(yè)的福安網(wǎng)站建設(shè)公司,福安接單;提供網(wǎng)站建設(shè)、成都做網(wǎng)站,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進行福安網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!
org.Hs.eg.db包含有多種gene_name的類型
keytypes() :keytypes(x),查看注釋包中可以使用的類型
columns() :類似于keytypes(),針對org.Hs.eg.db兩個函數(shù)返回值一致
select() :select(x, keys, columns, keytype, ...) eg.
函數(shù)enrichGO()進行GO富集分析,enrichGO()的使用方法:
舉例:
q1, 首先要確定是barplot還是hist,如果是barplot的話,應(yīng)該不存在breaks的問題,因為barplot的傳入?yún)?shù)是個矩陣;
我假設(shè)你要畫的是個hist,我偶遇過這個問題,我的理解是hist的breaks的值要能被范圍整除才行;比如x=1:200,break=7的話,就只能畫出4個柱來,但如果breaks=10就沒問題;基本上是這樣的,偶爾也有例外;比如break=5就不行....奇怪得很
最后,沒辦法的辦法,就只能用barplot代替hist了,barplot肯定不會有這個問題,統(tǒng)計下hist參數(shù)中的分布情況,轉(zhuǎn)換成矩陣,用barplot吧;
q2, 貌似一般都用一組因素把這些類別區(qū)分開,我用abcde,表示你的小學(xué),中學(xué)...了,比如這樣:
a=1:7;b=8:10;c=c(9,10,11);d=c(40,55);e=100:110f=factor(c(rep(1,sum(length(a),length(b),length(c))),rep(2,sum(length(d),length(e)))))#先用c()生成數(shù)組,在轉(zhuǎn)換成factor,其實數(shù)組也ok的,不過plot()中兩個數(shù)組和factor不一樣 x=c(a,b,c,d,e)plot(x~f)q3, 就我所知不行;yes或no一定也要是能映射到x,y范圍內(nèi)的點才行;你是想表示分類結(jié)果嗎?如果是的話,通常用顏色,或者在點旁邊的text表示。
q4, 舉個例子吧
x=-50:50y=x^2+x+1z=10*abs(x)+1 plot(x,y,type='l')lines(x,z,lty=3)legend(c('type1','type2'), x=-20,y=2500, col=c('black','red'), lty=c(1,3))legend的x和y是legend的左上角,匿名參數(shù)是類型名稱,col,lty,pch 是對應(yīng)的顏色,線類型,和點類型。
最后,我現(xiàn)在多用ggplot2,如果不抵觸的話可以看看,和R的基礎(chǔ)作圖包思路不是很一樣,但是圖很清新的;
如果還有問題,建議把數(shù)據(jù)集data.frame粘貼幾行上來,我也試試;
ggsurvplot(
fit, #生存分析結(jié)果
data = NULL, # a dataset used to fit survival curves
fun = NULL, # 定義生存曲線轉(zhuǎn)換的任意函數(shù)。 經(jīng)常使用的轉(zhuǎn)換可以用字符參數(shù)指定:“event”繪制累積事件(f(y) = 1-y),“cumhaz”繪制累積風(fēng)險函數(shù)(f(y) = -log(y)),“pct”以百分比表示生存概率。
color = NULL, #曲線顏色
palette = NULL, #顏色調(diào)色板,可選調(diào)色板有 "grey","npg","aaas","lancet","jco", "ucscgb","uchicago","simpsons"和"rickandmorty".
linetype = 1, #線條形狀,可以用數(shù)值型向量1,2表示,也可以用字符串向量c("solid", "dashed").
conf.int = FALSE, #是否畫出置信區(qū)間
pval = FALSE, #是否顯示P值
pval.method = FALSE, #是否添加計算P值得方法得文本,前提是pval = TRUE
test.for.trend = FALSE, #默認(rèn)是F,如果TURE,返回trend Pvalues檢驗。 趨勢檢驗旨在檢測生存曲線的有序差異。 也就是說,至少對一個群體來說。 只有組數(shù)為 2時,才能進行趨勢測試。
surv.median.line = "none", #畫一條水平或者垂直得生存中位值線,允許的值有c("none", "hv", "h", "v"). v: 垂直vertical, h:水平horizontal.
risk.table = FALSE, #是否顯示風(fēng)險table。其他值有absolute" or "percentage",顯示絕對數(shù)值/百分比;參數(shù)"abs_pct" ,百分比以及絕對數(shù)值都顯示
cumevents = FALSE, # logical value specifying whether to show or not the table of the cumulative number of events.
cumcensor = FALSE, #logical value specifying whether to show or not the table of the cumulative number of censoring.
tables.height = 0.25, #設(shè)置table得高度,取值范圍0-1
group.by = NULL, #包含分組變量名稱得字符串向量。長度=2
facet.by = NULL, #一個字符向量,包含將生存曲線分成多個面板的分組變量的名稱。
add.all = FALSE, #一個邏輯值。 如果為TRUE,則在主圖中添加合并患者(null model)的生存曲線。
combine = FALSE, # a logical value. If TRUE, combine a list survfit objects on the same plot.
ggtheme = theme_survminer(), #主題名稱
tables.theme = ggtheme, #主題名稱,默認(rèn)是theme_survminer.
... #后面描述的參數(shù)和其他參數(shù)將被傳遞給ggplot2 geom_*()函數(shù),如linetype, size, ii)或ggpar()函數(shù)來定制圖形。 看到的細(xì)節(jié)部分
)
查看GOplot內(nèi)示例數(shù)據(jù)的格式,對自己的數(shù)據(jù)做處理
觀察結(jié)論:
觀察自己的兩個數(shù)據(jù)表:
table.legend 設(shè)置為T時會顯示表格
本圖中表格和圖例是出圖后剪切拼合而成,沒有用R中的拼圖包
之前分享了如何用ggplot2可視化GO分析的結(jié)果。既然做了GO,當(dāng)然少不了KEGG了。
同樣的,我們從 DAVID 獲取KEGG pathway的結(jié)果。
對于KEGG,我比較喜歡做氣泡圖,這樣用兩種形式的圖結(jié)合在一起,效果更豐富更好看一點。
前面我給大家詳細(xì)介紹過
?GO簡介及GO富集結(jié)果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結(jié)果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經(jīng)過我的認(rèn)真研究,發(fā)現(xiàn)跟R版本有關(guān)。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應(yīng)的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關(guān)的函數(shù)拿出來認(rèn)真的研究了一下,終于發(fā)現(xiàn)的癥結(jié)所在。
dotplot這個函數(shù),多了個 label_format 參數(shù)
我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數(shù)默認(rèn)值是30,當(dāng)標(biāo)簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下這個參數(shù),把他設(shè)置成100,讓我們的標(biāo)簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復(fù)原來的容貌。
關(guān)于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
分享題目:如果用R語言作go分析圖 r語言做go富集
網(wǎng)站鏈接:http://m.kartarina.com/article34/dodsjse.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站導(dǎo)航、面包屑導(dǎo)航、網(wǎng)站設(shè)計、小程序開發(fā)、網(wǎng)站內(nèi)鏈、網(wǎng)站設(shè)計公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)