Pheatmap怎样绘制热图

Pheatmap怎样绘制热图,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

随机生成,10个基因,每个基因4个处理,每个处理3个平行,表达量RPKM值在1-120之间,矩阵第一个RPKM数值为250:

> library(pheatmap)

> data <- matrix(runif(120,0,120),ncol=12)

> data[1] <- 250

> colnames(data) <- c(paste0('tr_1_',seq(1,3)),paste0('tr_2',seq(1,3)),paste0('tr_3',seq(1,3)),paste0('tr_4',seq(1,3)))

> rownames(data) <- c(paste0('gene',seq(1,10)))

运行过程生成matrix和图片:

Pheatmap怎样绘制热图  pheatmap 第1张

Pheatmap怎样绘制热图  pheatmap 第2张

利用border_color参数修改边界颜色:

>pheatmap(data,border_color = "blue")

> pheatmap(data,border_color = "red")

> pheatmap(data,border_color = "pink")

> pheatmap(data,border_color = "green")

Pheatmap怎样绘制热图  pheatmap 第3张

Pheatmap怎样绘制热图  pheatmap 第4张

Pheatmap怎样绘制热图  pheatmap 第5张

Pheatmap怎样绘制热图  pheatmap 第6张

colorRampPalette参数的使用:

> colors <- colorRampPalette(c("blue", "red"))(5)#颜色从蓝色到红色渐变色,5表示长度为5的颜色梯度

> colors

[1] "#0000FF" "#3F00BF" "#7F007F" "#BF003F" "#FF0000"

> pheatmap(data,border_color = "yellow",color=colorRampPalette(c('#00ff00','white','#EE0000'))(100))

运行结果如下:

Pheatmap怎样绘制热图  pheatmap 第7张

scale参数的使用:

scale是指对数值进行均一化处理,在基因表达量的数据中,有些基因表达量极低,有些基因表达量极高,因此把每个基因在不同处理和重复中的数据转换为平均值为0,方差为1的数据,可以看出每个基因在某个处理和重复中表达量是高还是低。

Pheatmap怎样绘制热图  pheatmap 第8张

“row”、“colume”、“none”分别表示对成行或成列的进行均一化,或不做均一化,一般数据处理中基因的表达量做均一化处理,选择“row”

> pheatmap(data,border_color = "yellow",color = colorRampPalette(c('pink','blue'))(100),scale='row')

Pheatmap怎样绘制热图  pheatmap 第9张

参数:cluster_rows/cluster_cols和cellwidth/cellheight

对基因的顺序进行聚类,因此可使用cluster_rows/cluster_col来修改;同时可以使用cellwidth/cellheight对每个单元方块的大小进行设置:

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20)

Pheatmap怎样绘制热图  pheatmap 第10张

参数:legend/legend_breaks/legend_labels

使用legend阈值逻辑值来对色度条进行隐藏,以及对色度条上对应位置的字符进行修改:

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20,legend_breaks = c(-2.5,0,2.5),legend_labels = c('>=-2.5','0','2.5'))

运行结果如下:

Pheatmap怎样绘制热图  pheatmap 第11张

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20,legend=FALSE,legend_breaks = c(-2.5,0,2.5),legend_labels = c('>=-2.5','0','2.5'))

Pheatmap怎样绘制热图  pheatmap 第12张

参数:gaps_row/gaps_col、cutree_rows/cutree_cols和treeheight_row/treeheight_col

cutree_rows按聚类分割,如cutree_rows=2,把基因表达量聚类分成2类;gaps_col=c(3,6,9)不能聚类,把重复都分开。gaps_XX对行或列进行分割,就不应对相应的行或列进行聚类;treeheight_row参数改变聚类的支长长度:

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20,legend=FALSE,legend_breaks = c(-2.5,0,2.5),legend_labels = c('>=-2.5','0','2.5'),cutree_rows = 2,gaps_col = c(3,6,9),treeheight_row = 10)

Pheatmap怎样绘制热图  pheatmap 第13张

参数:annotation_row/annotation_col、annotation_colors、annotation_legend和annotation_names_row/annotation_names_col

利用annotation_col参数,给各个处理添加一个颜色标签;

利用annotation_colors对标签的颜色进行修改;

利用annotation_legend设置是否显示标签注释条;

利用annotation_names_col设置是否显示标签名称。

>annotation_col=data.frame(treat=factor(rep(paste0('T',1:4),each=3)),class=factor(rep(paste0('class',1:2),each=6)))

>ann_color=list(a=c(T1='yellow',T2='#757083',T3='firebrick',T4='#66A61E'),b=c(class1='blue',class2='#1B9E77'))

> row.names(annotation_col)=colnames(data)

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20,legend_breaks = c(-2.5,0,2.5),legend_labels = c('>=-2.5','0','2.5'),cutree_rows = 2,gaps_col = c(3,6,9),treeheight_row = 10,annotation_col=annotation_col,annotation_legend=TRUE,annotation_colors=ann_color,annotation_names_col=TRUE)

运行过程中产生数据与图:

annotation_col:

Pheatmap怎样绘制热图  pheatmap 第14张

Pheatmap怎样绘制热图  pheatmap 第15张

参数:display_numbers、number_format、number_color和fontsize_number

利用display_numbers参数可以在每个单元框内显示每个方框对于的数据,其中有三个选项,TRUE、FALSE以所对应的数据,如果设置display_numbers=T,这显示做了均一化的数据(如果之前使用过scale参数),设置display_numbers=data,则表示为直接显示原始数据,即可直接显示出RPKM值在单元格中;

number_color顾名思义就是这是设置显示数据的颜色了

fontsize_number则为显示每个数据的大小;

 利用number_format可以设置保留小数位数或者字符串格式(如%.2f),但仅有在display_numbers=T时才能使用,很鸡肋,因此不建议使用该参数,而我们一般是直接显示RPKM值,所以我们需要之前对数据集进行保留小数处理,不然数据显示会超出单元格

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20,legend_breaks = c(-2.5,0,2.5),legend_labels = c('>=-2.5','0','2.5'),cutree_rows = 2,treeheight_row = 10,annotation_col=A,annotation_legend=TRUE,annotation_colors=ann_color,annotation_names_col=TRUE,display_numbers = TRUE,number_color = 'red',fontsize_number = 8,number_format = "%.2f")

运行结果如下:

Pheatmap怎样绘制热图  pheatmap 第16张参数:show_rownames/show_colnames、fontsize_col/fontsize_row、fontsize和main

show_rownames表示是否显示gene名称,用逻辑值设置,fontsize_col设置横坐标名称的大小,fontsize则是设置所有除主图以外的标签的大小,利用main设置热图的名称,如:

>pheatmap(data,border_color='yellow',color=colorRampPalette(c('pink','blue'))(100),scale='row',cluster_cols = FALSE,cellwidth = 20,cellheight = 20,legend_breaks = c(-2.5,0,2.5),legend_labels = c('>=-2.5','0','2.5'),cutree_rows = 2,treeheight_row = 10,annotation_col=A,annotation_legend=TRUE,annotation_colors=ann_color,annotation_names_col=TRUE,display_numbers = TRUE,number_color = 'red',fontsize_number = 8,number_format = "%.2f",show_rownames = FALSE,fontsize_col = 15,fontsize=5,main = "heatmap test 2")

Pheatmap怎样绘制热图  pheatmap 第17张

看完上述内容,你们掌握Pheatmap怎样绘制热图的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注蜗牛博客行业资讯频道,感谢各位的阅读!

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:niceseo99@gmail.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

评论

有免费节点资源,我们会通知你!加入纸飞机订阅群

×
天气预报查看日历分享网页手机扫码留言评论电报频道链接