R语言两组变量特征相关关系热图绘制画法
作者:hxj7
本文为大家介绍了如何画两组变量(特征)的相关关系热图的方法详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
准备数据
两组变量的数据可以像下面这样处理,分别保存在两个csv文件中。
> # 导入数据及数据预处理 > setwd("D:/weixin/") > rows <- read.csv("rows.csv") > cols <- read.csv("cols.csv") > str(rows) 'data.frame': 100 obs. of 6 variables: $ r1: num 476 482 640 452 308 ... $ r2: num 2059 1987 1952 1927 1854 ... $ r3: num 513 601 682 497 463 ... $ r4: num 2235 2114 2038 1945 1916 ... $ r5: num 433 376 525 395 238 ... $ r6: num 2028 1943 1802 1775 1748 ... > str(cols) 'data.frame': 100 obs. of 5 variables: $ c1: num 2387 2437 2484 2349 2198 ... $ c2: num 540 535 706 509 359 ... $ c3: num 472 610 465 473 471 ... $ c4: num 74.4 57.3 49.5 51.8 47.6 ... $ c5: num 995 915 1038 794 652 ...
简单热图
> # 构建相关关系矩阵 > library(psych) > data.corr <- corr.test(rows, cols, method="pearson", adjust="fdr") > data.r <- data.corr$r # 相关系数 > data.p <- data.corr$p # p值 > > # 画热图 > library(pheatmap) > pheatmap(data.r, clustering_method="average")
只对列进行聚类
> pheatmap(data.r, clustering_method="average", cluster_rows=F)
将相关系数显示在图上
> data.r.fmt <- matrix(sprintf("%.2f", data.r), nrow=nrow(data.p)) # 只保留小数点后两位 > pheatmap(data.r, clustering_method="average", cluster_rows=F, display_numbers=data.r.fmt)
在图上加上显著性标记
> getSig <- function(dc) { + sc <- '' + if (dc < 0.01) sc <- '***' + else if (dc < 0.05) sc <- '**' + else if (dc < 0.1) sc <- '*' + sc + } > sig.mat <- matrix(sapply(data.p, getSig), nrow=nrow(data.p)) > str(sig.mat) chr [1:6, 1:5] "*" "***" "" "***" "***" "***" "***" "" "***" "**" ... > pheatmap(data.r, clustering_method="average", cluster_rows=F, display_numbers=sig.mat)
如果想进一步改变图形效果,可以参考pheatmap函数的用法,修改相应的参数。比如:聚类方式改为complete,加上标题等。
> pheatmap(data.r, clustering_method="complete", cluster_rows=F, display_numbers=sig.mat, main="Corr Heatmap")
以上就是R语言两组变量特征相关关系热图绘制画法的详细内容,更多关于R语言绘制相关关系热图的资料请关注脚本之家其它相关文章!