拯救混乱的组学图表：手把手教你用ComplexHeatmap拼接多组热图与注释-港品优选

拯救混乱的组学图表：手把手教你用ComplexHeatmap拼接多组热图与注释

在生物信息学研究中，我们常常需要同时展示多个组学数据集（如转录组、蛋白组、代谢组）的分析结果。这些数据通常共享相同的样本但具有不同的特征维度，如何将它们清晰、美观地整合在一张图中，是每个科研人员都会遇到的挑战。传统方法往往导致图表排版混乱、图例不统一、注释错位等问题，严重影响数据呈现的专业性和说服力。

ComplexHeatmap作为R语言中最强大的热图可视化工具，提供了完整的解决方案。本文将聚焦多热图拼接这一核心需求，通过7个实战案例演示如何用+和%v%操作符实现专业级的组学图表整合。无论您是需要对比不同实验条件的表达模式，还是展示多组学数据的关联分析，这些技巧都能让您的图表质量提升到发表级水准。

1. 多热图拼接基础原理

1.1 HeatmapList对象解析

ComplexHeatmap通过HeatmapList类管理多个热图的布局关系。当我们使用+或%v%连接多个Heatmap对象时，系统会自动创建这种特殊容器：

library(ComplexHeatmap) mat1 <- matrix(rnorm(100), 10) mat2 <- matrix(runif(100), 10) ht1 <- Heatmap(mat1, name = "expression") ht2 <- Heatmap(mat2, name = "methylation") ht_list <- ht1 + ht2 # 水平拼接

关键特性：

自动对齐：共享的行/列会自动匹配顺序
智能优化：默认只保留第一个热图的聚类树和行名
统一尺度：可通过heatmap_legend_param控制图例一致性

1.2 两种拼接方式对比

操作符	方向	适用场景	示例
`+`	水平	同一样本的不同特征比较	基因表达vs蛋白丰度
`%v%`	垂直	相同特征的不同样本/条件比较	癌组织vs正常组织

2. 实战案例：多组学数据整合

2.1 转录组与蛋白组联合展示

假设我们同时检测了mRNA表达和蛋白丰度数据：

# 模拟数据 set.seed(123) rna_mat <- matrix(rnorm(50*20), 50, 20) protein_mat <- matrix(rnorm(30*20), 30, 20) colnames(rna_mat) <- colnames(protein_mat) <- paste0("Sample", 1:20) # 创建注释 ha <- HeatmapAnnotation( group = rep(c("Control", "Treatment"), each=10), col = list(group = c("Control" = "grey", "Treatment" = "orange")) ) # 构建热图 ht1 <- Heatmap(rna_mat, name = "mRNA", top_annotation = ha, column_title = "Transcriptome") ht2 <- Heatmap(protein_mat, name = "Protein", column_title = "Proteome") # 水平拼接 draw(ht1 + ht2, column_title = "Multi-omics Integration")

关键调整：

使用row_km参数对行进行一致性聚类
通过gap = unit(5, "mm")控制热图间距
用heatmap_legend_param统一图例风格

2.2 时间序列数据垂直拼接

对于不同时间点的观测数据，垂直布局更直观：

time1 <- matrix(rnorm(100), 10) time2 <- matrix(rnorm(100, mean=2), 10) ht_time1 <- Heatmap(t(time1), name = "Day1", cluster_rows = FALSE) ht_time2 <- Heatmap(t(time2), name = "Day2", cluster_rows = FALSE) # 垂直拼接 ht_time1 %v% ht_time2

3. 高级布局控制技巧

3.1 子图尺寸精确调控

当热图尺寸差异较大时，需要手动调整比例：

ht1 <- Heatmap(mat1, name = "main", width = unit(10, "cm")) ht2 <- Heatmap(mat2, name = "supp", width = unit(4, "cm")) # 固定比例拼接 ht1 + ht2

实用参数：

width/height：绝对尺寸控制
heatmap_width：相对权重设置
size函数：查询当前热图尺寸

3.2 混合方向拼接

复杂场景可能需要同时使用水平和垂直拼接：

top <- ht1 + ht2 bottom <- ht3 + ht4 final_plot <- top %v% bottom

4. 注释系统深度整合

4.1 共享注释设置

避免为每个热图重复定义注释：

shared_anno <- HeatmapAnnotation( df = anno_df, bar = anno_barplot(bar_data), which = "column" # 应用到所有列注释 ) ht1 <- Heatmap(mat1, top_annotation = shared_anno) ht2 <- Heatmap(mat2, top_annotation = shared_anno)

4.2 跨热图注释联动

实现行注释与主热图的自动同步：

row_ha <- rowAnnotation( foo = anno_mark(at = c(1:5), labels = rownames(mat)[1:5]) ) ht_list <- ht1 + row_ha + ht2

5. 输出优化与问题排查

5.1 常见报错解决方案

错误类型	可能原因	解决方案
热图错位	行列名不一致	检查`colnames()`/`rownames()`
图例显示异常	颜色映射范围不当	调整`colorRamp2`参数
拼接后空白区域过多	尺寸单位设置不合理	使用`unit()`明确指定单位

5.2 发表级图表输出设置

pdf("multi_heatmap.pdf", width=12, height=8) draw(ht_list, padding = unit(c(2, 10, 2, 2), "mm")) # 边距调整 dev.off()

推荐格式：

矢量图：PDF/EPS（适合论文投稿）
高分辨率位图：PNG/TIFF（≥300dpi）

6. 复杂案例：TCGA多组学分析

以下展示TCGA肿瘤数据分析的完整流程：

# 加载多组学数据 load("tcga_data.RData") # 包含RNA, miRNA, methylation矩阵 # 创建统一注释 tcga_anno <- HeatmapAnnotation( subtype = tcga_clin$Subtype, stage = tcga_clin$Stage, col = list( subtype = c("LumA" = "pink", "Basal" = "blue"), stage = colorRamp2(c(1,4), c("white", "red")) ) ) # 构建热图列表 rna_ht <- Heatmap(t(scale(rna_mat)), name = "RNA", top_annotation = tcga_anno, show_row_names = FALSE) mirna_ht <- Heatmap(t(scale(mirna_mat)), name = "miRNA", show_row_names = FALSE) meth_ht <- Heatmap(t(scale(meth_mat)), name = "Methylation", show_row_names = FALSE) # 最终拼接 tcga_plot <- rna_ht %v% mirna_ht %v% meth_ht

7. 动态交互扩展

虽然ComplexHeatmap本身是静态可视化工具，但可通过以下方式增强交互性：

library(InteractiveComplexHeatmap) ht <- Heatmap(mat, name = "interactive") htShiny(ht) # 启动交互界面

交互功能：

鼠标悬停查看数值
点击选择行列子集
动态调整聚类参数

企业官网建设流程全解析