MicrobiomeStatPlot | 桑基图教程Sankey plot tutorial

摘要:桑基图又称桑基能量分流图或桑基能量平衡图,是一种特定类型的流程图,是一种表现数据间包含和权重关系流向的统计图标,常见的布局形式有左右流向布局和上下流向布局,其中线条的粗细代表了数值的大小,线条的颜色代表不同的分支种类,通过线条流动的位置和归属,来表现各类别数据

桑基图简介

桑基图又称桑基能量分流图或桑基能量平衡图,是一种特定类型的流程图,是一种表现数据间包含和权重关系流向的统计图标,常见的布局形式有左右流向布局和上下流向布局,其中线条的粗细代表了数值的大小,线条的颜色代表不同的分支种类,通过线条流动的位置和归属,来表现各类别数据之间的包含关系。

桑基图的起始流量和结束流量相同,所有主支宽度的总和与所有分出去的分支宽度总和相等,保持能量的平衡;各主支和分支不同的宽度代表了不同的流量大小;不同宽度的线条代表了不同的流量分流情况,线条的宽度成比例地显示此分支占有地流量。

桑基图用于描述一组数值转化成另一组数值的流向,观察数据的流转情况。

标签:#

微生物组数据分析 #MicrobiomeStatPlot #桑基图 #R语言可视化 #Sankey plot

作者:

First draft(初稿):Defeng Bai(白德凤);Proofreading(校对):Ma Chuang(马闯) and Jiani Xun(荀佳妮);Text tutorial(文字教程):Defeng Bai(白德凤)

源代码及测试数据链接:

https://github.com/YongxinLiu/MicrobiomeStatPlot/项目中目录 3.Visualization_and_interpretation/SankeyPlot

桑基图应用案例

本文是上海交通大学Chen Haoyan课题组于2023年发表于Cell Host & Microbe上的一篇文章用到的桑基图和气泡图结合,展示KEGG功能通路和KO基因差异。题目为:Multi-kingdom gut microbiota analyses define bacterial-fungal interplay and microbial markers of pan-cancer immunotherapy across cohorts.

图 6 | PD-1 阻断剂应答者和非应答者的微生物功能变化

(左)Sankey 图显示京都基因组百科全书(KEGG)水平的分布和涉及新陈代谢的不同 KO 基因。(右图)气泡图显示 KO 基因的广义折叠变化。点的颜色代表 -log10(FDR)。

结果

肠道微生物群可以调节宿主的生理机能和维持宿主的健康。由于应答者和非应答者的肠道微生物组不同,作者假设微生物功能在两种应答表型中表现出不同的模式。为了验证这一假设,文章研究了接受抗PD-1单药治疗的4个数据集中的《京都基因组百科全书》(KEGG)正选(KO)基因、通路和EggNOG正选基因的功能变化。应答者中最明显富集的代谢 KO 基因参与了嘌呤代谢,其次是一个参与丁酸代谢的基因(图6A)。K00700(EC:2.4.1.18)参与淀粉和蔗糖代谢(图 6A),直接负责从淀粉中合成淀粉。

桑基图R语言实战

软件包安装

# 基于CRAN安装R包,检测没有则安装p_list = c("ggalluvial", "ggplot2")for(p in p_list){if (!requireNamespace(p)){install.packages(p)} library(p, character.only = TRUE, quietly = TRUE, warn.conflicts = FALSE)}# install.packages("devtools")# 基于github安装library(devtools)if(!requireNamespace("amplicon", quietly = TRUE)) install_github("davidsjoberg/ggsankey")# 加载R包 Load the packagesuppressWarnings(suppressMessages(library(ggalluvial)))suppressWarnings(suppressMessages(library(ggplot2)))suppressWarnings(suppressMessages(library(ggsankey)))

实战

# 读取数据# Load datadf01 data # 转换为lodes形式数据# Data format transformationdf # 自定义配色方案,使用更现代的调色板,并控制色彩平衡# Set colorcolors '#cdb1d2', '#fae6f0', '#eb6fa6', '#ff88b5', '#00b1a5',"#ffa68f","#ffca75","#97bc83","#acd295", "#00ada1","#009f93","#ace2da","#448c99","#00b3bc","#b8d8c9","#db888e","#e397a4","#ead0c7", "#8f9898","#bfcfcb"))(67)# 绘制桑基图,调整形状比例,使用新的曲线类型以提高视觉效果# Plotp1 geom_flow(width = 0.15, curve_type = "cubic", alpha = 0.7, color = 'gray80', size = 0.2) + geom_stratum(width = 0.15, color = "gray90") + geom_text(stat = 'stratum', size = 3, color = 'gray30') + scale_fill_manual(values = colors) + theme_minimal + theme(legend.position = 'none', axis.title = element_blank, axis.text = element_blank, panel.grid = element_blank, plot.margin = margin(5, 5, 5, 5))# 保存图像# Save plotggsave(filename = "results/Figure_sankey.pdf", plot = p1, width = 7, height = 5, useDingbats = FALSE, limitsize = FALSE)

使用此脚本,请引用下文:

Yong-Xin Liu, Lei Chen, Tengfei Ma, Xiaofang Li, Maosheng Zheng, Xin Zhou, Liang Chen, Xubo Qian, Jiao Xi, Hongye Lu, Huiluo Cao, Xiaoya Ma, Bian Bian, Pengfan Zhang, Jiqiu Wu, Ren-You Gan, Baolei Jia, Linyang Sun, Zhicheng Ju, Yunyun Gao, Tao Wen, Tong Chen. 2023. EasyAmplicon: An easy-to-use, open-source, reproducible, and community-based pipeline for amplicon data analysis in microbiome research. iMeta 2: e83. https://doi.org/10.1002/imt2.83

Copyright 2016-2024 Defeng Bai baidefeng@caas.cn, Chuang Ma 22720765@stu.ahau.edu.cn, Jiani Xun 15231572937@163.com, Yong-Xin Liu liuyongxin@caas.cn

宏基因组推荐

本公众号现全面开放投稿,希望文章作者讲出自己的科研故事,分享论文的精华与亮点。

投稿请联系小编(-genomics)

iMeta高引文章 fastp 复杂热图 ggtree 绘图imageGP 网络iNAP

iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla

iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature

为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

来源:微生物组

相关推荐