# 基础模块
# 面积图
简介
面积图是一种基于折线图并以图形方式显示定量数据的图形。轴和线之间的区域通常用颜色、纹理和图案来强调。
案例数据分析
载入数据为 x 轴数值和 y 轴数值。
案例统计图形解读
不同颜色代表不同组的面积图。
# 条码图
简介
适用于展示大量数据的分布情况
案例数据分析
案例数据为某商品在三个地区各500个门店的销售额
通过条码图可以看到该商品在广东和福建地区销售额分布在50左右的门店数量较多,且在广东各门店之间销售额差异较小,分布较集中
特殊参数
title:标题
x_label: x轴名称
y_label: y轴名称
width:条带宽度
height:条带高度
color:条带颜色
# 3D 柱状图
简介
三维柱状图用于为数据提供三维外观。 第三维通常出于美学原因而使用,但其不能改善数据的读取。 仍旨在显示离散类别之间的比较。
案例数据分析
载入数据为不同治疗方案中不同剂量药物作用效果数据。
案例统计图形解读
该三维柱状图展示了不同治疗组(组 1 ~ 组 4)分别用低、中、高剂量进行治疗时,不同的治疗效果。组 1 使用中剂量治疗时效果最好,组 2 使用高剂量治疗时效果最好,组3使用剂量治疗时无较大差距,组 4 使用高剂量治疗时效果最好。
特殊参数
俯仰角:正值越大,表示趋于从三维图形顶端向下观测;负值越大,表示趋于从三维图形底端向上观测。
水平旋转角度:三维图形水平旋转的角度。
# 颜色组柱状图
颜色组柱状图可以用于分组展示数据值,并按顺序标注不同颜色,常应用于 GO/KEGG 通路富集分析结果的可视化。
数据表格(三列):
Term | 条目名称,如 GO/KEGG 通路名称
Count | 条目的数值大小,如某通路富集到的基因数
Type | 该通路所属大类:如 BP/MF/CC/KEGG
特殊参数:
展示数目 | 用于控制柱状图中各分组所展示的最多条目数量,如设置为 4,则只取 Type 各分组的分别前 4 条记录
# 误差线条形图2
# 功能介绍
带误差线和误差组的条形图。
# 误差线条形图
# 功能介绍
带误差线和误差组的条形图。
# 渐变柱状图
简介
同气泡图相似,不过是在柱状图的基础上,用颜色渐变的长方形同时展示两个变量的可视化图形。
案例数据分析
第一列为Go Term(Go语言编号),第二列为基因数,第三列输入pvalue。
案例统计图形解读
如图示,蓝色为低pvalue颜色,红色为高pvalue颜色,随着pvalue增大颜色由蓝向红渐变。横坐标表示基因数目。
特殊参数
展示数目:展示Go Term中Go id数量
水平:开启时纵坐标为Go id,横坐标为数值,图形呈现水平排列的长方形。关闭时横纵坐标对调,图形呈现纵向排列的长方形。
低数值颜色:表示低pvalue所显示的颜色
高数值颜色:表示高pvalue所显示的颜色
# 多变量线图
# 功能介绍
在一个图表中显示多个条形图或线形图。
# 数据结构
具有多列数据(数字)的数据框。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Plot Type: 图像的类型(线图或条形图)
Line Size: 线图对应线条的宽度
Point Size: 数据点的大小
# 柱状图
简介
柱状图是一种以长方形的长度表示数据值大小的统计图表。
案例数据分析
载入数据为不同治疗方案中不同剂量药物作用效果数据。
案例统计图形解读
条形图用于显示带有矩形条的类别数据, 矩形条的高度或长度与它们所代表的值成比例。条形图可以垂直或水平绘制。条形图显示了离散类别之间的比较。 图表的一个轴显示要比较的特定类别,另一个轴代表测量值。 一些条形图显示的条形也可显示多个测量变量的值。该条形图展示了不同治疗组(组 1 ~ 组 4)分别用低、中、高剂量进行治疗时,不同的治疗效果。组 1 使用中剂量治疗时效果最好,组 2 使用高剂量治疗时效果最好,组 3 使用剂量治疗时无较大差距,组 4 使用高剂量治疗时效果最好。
特殊参数
叠加类型:dodge 表示横向罗列,stack 表示上下叠加
水平:互换类别轴与测量值轴的位置
添加数字标签:标注数值
# 豆荚图
简介
豆荚图是一种描述一组数据分布特征的方法。
案例数据分析
载入数据为数据集 (不同治疗方案的治疗效果数据)。
# 蜜蜂群图
简介
蜜蜂群图是一种类似蜜蜂群,样本间互不干涉的列散点图。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形解读
不同颜色表示不同组群 ,点表示数据。
# 大样本相关性热图 (Corrplot)
简介
相关性热图是一种分析多个变量,两两之间相关性的图形。
案例数据分析
载入数据为基因名称及每个样本的表达量。
案例统计图形分析
红色系表示两个基因之间呈正相关,蓝色系表示两个基因之间呈负相关,每一格中的数字表示相关系数。
# 多百分比图
简介
显示多个双变量关系。
# 箱式图
简介
箱形图是一种通过四分位数图形象化地描述一组数据分布特征的方法。
案例数据分析
载入数据为数据集 (不同治疗方案的治疗效果数据)。
案例统计图形分析
横坐标表示几组不同的数据,纵坐标分别表示各组数据的四分位数;即方框上、中、下的横线分别代表上四分位数,中位数,下四分位数;上下方线段代表的数值分别指数据最大值和最小值,方框以外的点代表离群值。图示上方数值表示两两变量间的 P 值,可认为治疗方案 1 中,中剂量组同低剂量组疗效有显著差异,以此类推。
特殊参数
P 值展示形式:value 表示数值,signif 表示 "*" 的数量,no 表示不展示 P 值
添加散点:将数值表示的点标明出来
# 气泡图
简介
气泡图是在散点图的基础上,用气泡的大小来展示第三个变量,从而能够同时对三个变量进行对比分析的统计图表。
案例数据分析
载入数据为 GO Term, Gene Ridio,基因数和 P 值。
案例统计图形分析
x 轴表示 Gene Ridio,y 轴是 GO Term; 点的大小表示基因数,点的颜色代表 P 值的高低。
特殊参数
展示数目:显示气泡的数量
颜色主题:显示 P 值的颜色主题
# 凹凸图
- Introduction
凹凸图可以用于展示多组数值变化情况。
# 模型评估曲线图
# 功能介绍
校准曲线用于评估一致性/校准,即预测值和实际值之间的差异。
# 数据结构
多列数据的数据帧(数字允许NA)。ie生存数据(状态为0和1)。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Model: 模型计算的方法(默认为线性拟合模型)
CMethod: 检查模型的方法(默认为KM算法)
Method: 校准的方法(默认为Boot方法)
Time(Day): 时间,支持时间单位为天(默认365天)
# 卡方与 Fisher 检验
简介
卡方与 Fisher 检验可用于分类变量频数差异检验,该工具将自动选择卡方和 Fisher 确切性检验统计方法。
数据表
数据表支持两种格式:列联表(示例 1)和单行记录表(示例 2)
额外参数
循环方法 | 该工具会生成所有可以比较的排列组合,然后通过遍历分别检验两组间差异,可选按列联表的行和列遍历
添加均值 | 添加均值行加入检验遍历
添加中位数 | 添加中位数行加入检验遍历
# 弦图
# 功能介绍
复杂的数据关系交互作用以和弦图的形式表现出来。
# 数据结构
基因与通路或基因本体相互作用的数据框架或矩阵。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Dist Name: 标签与弦图的距离
Circle Width: 弦图环状的边框的宽度
Label Distance: 标签的距离
Link Visible: 弦图中纽带是否展示
Scale: 弦图是否按元素多少自由缩放占比展示
# 圆堆图
- 简介
用于展示不同类型之间的数量差异
特殊参数
add_label: 是否在圆圈内添加标签
alpha: 圆圈的颜色透明度
min_text_size: 最小标签字体大小
max_text_size: 最大标签字体大小
# 环形饼图
- 简介
饼图的另一种形式
特殊参数
show_label: 是否在饼图上显示标签
width: 条带宽度
bottom_text: 底部文字
label_size: 标签文字大小
简介
一个多组学插件同时绘制热图、注释和突变信息。
数据参数列
第一个值指定突变开始列。第二个值指定热图表达矩阵开始列。# 连接散点图
案例数据分析
案例数据为1991-2017年新生儿名为Alice和Anna的人数,通过人数数据绘制散点图,并按时序连接
特殊参数
label_ratio: 图像展示的标签比例,0为不展示标签,1为展示所有标签
line_color: 连线颜色
arrow_size: 箭头大小 0为不绘制箭头
label_size: 标签大小
# 等高线图(矩阵)
简介
等高图(矩阵)是一种以二维形式展示三维数据的图形。
案例数据分析
载入数据为一个矩阵。
案例统计图形分析
黄色代表最高,深紫色代表最低,高度刻度范围是90-190。
# 等高线图 (XY)
简介
等高线图 (XY) 是一种通过等高线反映数据密集程度的数据处理方式。
案例数据分析
载入数据为两个变量
案例统计图形分析
正如地理上的等高线代表不同高度一样,等高线图上的不同等高线代表不同密度,越靠中心,等高线圈越小,代表其区域数据密度程度越高。如:黄色区域数据密集程度最高,而蓝色区域数据密集程度最低。
# 相关性热图
简介
相关性热图是一种分析多个变量,两两之间相关性的图形。
案例数据分析
载入数据为基因名称及每个样本的表达量。
案例统计图形分析
红色系表示两个基因之间呈正相关,蓝色系表示两个基因之间呈负相关,每一格中的数字表示相关系数。
特殊参数
相关性计算(行/列):row 表示按照行进行相关性计算,col 表示按照列进行相关性计算。
选择展示部分:upper 表示显示左上角图形,lower 表示显示右下角图形,full 表示显示全景图片。
形状:circle 表示每个格子内的图形是圆圈,square 表示每个格子内的图形是正方形。
排序:按照得到的相关性系数进行排序。
# 简单可变相关热图
该插件提供了一个简单的相关热图可视化功能,它主要用于快速生成相关热图并支持在不同的轴上展示特定的变量。
核心参数:
- X 轴:设置显示在 X 轴的变量。
- Y 轴:设置显示在 X 轴的变量。
更多信息查看内部函数实现 (opens new window)。## 相关性热图 (Corrplot)
简介
相关性热图是一种分析多个变量,两两之间相关性的图形。
案例数据分析
载入数据为基因名称及每个样本的表达量。
案例统计图形分析
红色系表示两个基因之间呈正相关,蓝色系表示两个基因之间呈负相关,每一格中的数字表示相关系数。
# 自定义热图
简介
自定义热图,按照给定数据直接绘制热图
案例数据分析
案例数据为hiplot.org官方logo的灰度图像
表格数据说明
第一行表示各列的标题,往下各行为具体数据
第一列标题为
name
,请勿修改此列标题(name
),往下每行表示其行名特殊参数
low_color:较低的值的颜色
high_color:较高的值的颜色
text_size:行名和列名字体大小
circle_size:热图中圆圈大小
# 自定义图标散点图
简介
可自定义图标的散点图
参数说明
x:x轴坐标
y:y轴坐标
size:点(图像)大小
label_name: 图例名称
theme:绘图主题
symbol: 可选预设图像
svg_path:自定义svg绘图路径,例如
M150 0 L75 200 L225 200 Z
可绘制一个三角形,注意:定义此项时需将symbol置空
# ggplot2 词云
简介
词云是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高“关键词”进行可视化。
案例数据分析
载入数据名词和名词频数。
案例统计图形解读
图示显示心形图片,按照名词频数的大小显示其在词云图中的占比。
特殊参数
渐变模式:更改颜色为渐变
渐变深色:词频低的名词为深色
渐变高亮色:词频高的名词为浅色
# 系统树图
简介
系统树图是一种以树的形状表示的图。这种图表在不同情景有不同的含义。如:在层次聚类中,说明了相应分析产生的聚类的排列。在生物信息中,它显示基因或样本的聚集,有时在热图的边缘。
案例数据分析
载入数据为基因名称及其对应的基因表达值。
案例统计图形解读
该图如同垂直 90° 的树,M1-M10 表示树根,树枝向右生长聚合,形成树枝树干。可以看出,该图先后生成 2 类,4 类,以此类推。
特殊参数
分支数:
距离计算方法:更改计算树距离的方法
树的外形:更改树的形状
添加标签颜色:聚类后使样本相近的样本名称颜色相近
# 镜像密度图和直方图
简介
镜像密度图和直方图是一种使用上下双侧绘制方法用来观察连续型变量分布的图形
# 密度图-直方图
简介
使用密度图或直方图展示数据分布。
# 密度图
简介
核密度图是一种用来观察连续型变量分布的图形。
案例数据分析
载入数据为数据集 (不同治疗方案治疗效果数据)。
案例统计图形分析
不同颜色表示不同分组,横轴表示数值,纵轴表示频率。
特殊参数
堆积图形:
# 偏差图
简介
偏差图可以直观地展示出数据之间的差异
案例数据分析
案例数据为
mtcars
数据集,以name
(车型)为键,mpg
(燃油效率)为值绘图案例统计图形解读
计算
mpg
的z-score
,对其进行排序并以0为界限分类,左侧为低效率组,右侧为高效率组特殊参数
sort_method:可指定升序排列或降序排列
# 扩散映射
简介
扩散映射(diffusion-map)是一种非线性降维算法,可以用于可视化发育轨迹。
# 双侧标准化图
简介
双侧标准化图是一种将连续的,定量的输入映射到连续的固定的插值器上的图形。
案例数据分析
第一列为模型名称列表,其余列输入相关指标及对应数值。
案例统计图形解读
图示横轴表示hp数据,纵轴表示模型名称(分类),红色表示超过平均值的模型,蓝色表示低于平均值的模型,数据是按照大小赋值于 2 的比例尺上面。
特殊参数
类型:lollipop 表示中轴线两侧绘制滑珠图;bar 表示中轴线两侧绘制条形图。
标准化:标准化打开是将数据进行标准化后,显示在±2的比例尺上,标准化关闭显示纵向滑珠图和柱状图。
线条大小:随着右拉数值增大,从纵轴延伸出去的红蓝线增粗。
点大小:随着右拉数值增大,红蓝线终点处定位横纵数值的点变大。
颜色:表示线条颜色,默认红色为正向线条颜色,蓝色为负向线条颜色。
# 环形图
简介
环形图是饼图的一种变体,它有一个允许包含数据整体额外信息的空白中心。且与饼图目的一致,都是用来说明数据比例。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形解读
不同颜色表示不同组群 ,不同面积表示数据及占比。
# 滑珠图
简介
滑珠图是一种珠子在柱上滑行的图形,是条形图与散点图的叠加。
案例数据分析
载入数据为基因名称及其对应的基因表达值和分组。
案例统计图形分析
每种颜色表示不同的分组,能够直观了解不同基因表达值的差异。
# 双Y轴图
- 简介
双Y轴图可以将两组数量级较大的数据放在同一个图中进行展示。
- 案例数据分析
载入数据为分为三列,第一列是x轴的数值,第二列为左侧Y轴的数值,第三列为右侧Y轴的数值。
- 案例统计图形解读
案例数据中左侧Y轴比例尺量级在0-100的范围,而右侧Y轴比例尺则在0-1000。
- 特殊参数
放缩系数:用于第二个Y轴比例尺的放缩
颜色一:第一条折线的颜色
颜色二:第二条折现的颜色
# 凹凸图
- Introduction
凹凸图可以用于展示数值变化情况。
# 简易配对图
简介
显示一个矩阵图,用于查看多个变量的相关关系和数据分布。
# SOM 模型可视化
简介
建立 SOM 模型,并可视化结果
# 拓展散点图
简介
在散点图的基础上拓展边缘图像
特殊参数
add_rug: 是否在边缘添加rug
rug_alpha: rug的透明度
rug_size: rug的大小
rug_color: rug的颜色
marginal_type: 边缘图的类型,可选项为:histogram, boxplot, violinplot, qqplot, ppplot, densigram
marginal_fill: 边缘图的填充颜色
marginal_color: 边缘图的边框颜色
marginal_size: 边缘图的线宽
marginal_bins: 边缘图的柱形数量
# COX 模型森林图
简介
COX 模型森林图对 COX 模型构建风险森林图,以便于筛选变量的一种可视化图形。
案例数据分析
载入数据为时间,生存结局及多个变量因素。
案例统计图形解读
图示表格第一列表示变量及样本数,第二列森林图图示,第三列表示CI95%置信区间范围及其平均值和 P 值
森林图解读
中间垂直线表示无效线,横线表示该变量因素的95%置信区间,长短表示置信区间范围的大小,若某变量因素置信区间与无效线相交,则认为该变量因素无统计学意义,方块的位置是HR的点估计。
age 因素为控制变量。
ph.ecog 因素的发生率大于年龄因素的发生率,且 ph.ecog 因素会增加生存的发生(P < 0.001,有统计学意义)。
sex 因素的发生率小于年龄因素的发生率,且 sex 因素会减少生存的发生(P = 0.002 < 0.05,有统计学意义)。
特殊参数
合并模型:将多个变量因素整合进一个图标中。
去除控制变量:去除图表中 age 变量一行。
添加文字说明:在图标右下方标注标题。
# 扇形图
简介
扇形图是旨在以所占扇形的大小清楚表示各组数据所占百分比的统计图表。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形解读
不同颜色表示不同组群 ,不同面积表示数据及占比。
特殊参数
显示占比:在不同分组旁显示其占比
# 鱼形图
详细信息: https://github.com/chrisamiller/fishplot
数据表
timepoints:为矩阵的每一列指定时间点
parents:指定克隆之间的父母关系
samplename:样品名称(支持多个样品)
other:包含所有时间点所有克隆的肿瘤比例估计值的数值矩阵
通用参数
颜色画板: 控制背景颜色
颜色画板 2: 控制克隆颜色
额外参数
形状:形状类型
背景类型:提供背景类型的字符串
时间单位:时间点单位标签
描边宽度:多边形周围的边框线的宽度
左侧间距占比:第一个时间点左侧的增量数量。给出为总绘图宽度的一部分
竖线:添加时间点垂直线
克隆标签:添加克隆名称
校正缺失值:是否校正在非零值之间的时间点具有零值的克隆, 如果克隆再次出现,则克隆必须仍然存在
竖线颜色:时间点竖线颜色
描边颜色:形状的描边颜色
# 漏斗图 (Metafor)
简介
可以用于分析 Meta 分析结果中潜在偏倚因子。
# 漏斗图
简介
可以用于分析 Meta 分析结果中潜在偏倚因子。
# 甘特图
简介
甘特图是一种用来说明项目进度条形图。
案例数据分析
载入数据为 4 个样本即四位患者,3 个项目即 3 种治疗方法,以及每种治疗方法的起止时间。
案例统计图形解读
横轴表示时间进度,纵轴表示 4 位患者,3 种颜色表示 3 种治疗方法,该图可以观测到每位患者不同治疗方法使用的时间进度。
# 分布图
简介
分布图是一种采用置信分布的可视化图形。
案例数据分析
载入数据为 5 种条件及其对应的值。
案例统计图形解读
图示给出的是条件下均值的置信度分布,可以看出 5 种条件下对应值的大致分布情况。
# GGPIE
简介
饼图是通过将一个圆形切分成多个切片以显示每一部分所占总体比例的统计图表。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形分析
在一个圆图中,每个切片的弧长(其中心角和中心角所对应区域的弧长)与所表示的数量成正比。该饼图展示了 1~4 组分别的样本数量及样本数量所对应的占比。一组样本数量 13,占比 11.71%,二组样本数量 34,占比 30.63%,三组样本数量 21,占比 18.92%,四组样本数量 43,占比38.74%。
# ggpubr-boxplot
如果你对参数设定有什么疑问,可以自己利用示例数据进行尝试和理解,如果还是不懂,可以查阅 https://rpkgs.datanovia.com/ggpubr/reference/ggboxplot.html (opens new window) 或互联网材料。## 序列 LOGO
简介
序列 Logo 是一种用来描述结合位点序列模式的图形。
案例数据分析
载入数据为多个转录因子在多个基因上的结合位点的序列。
案例统计图形解读
采用 bits 计算的方式将一个结合位点序列展示在图表一列,可以清晰观测到不同序列占比较大的碱基。
特殊参数
序列类型:dna 表示 DNA 序列,rna 表示 RNA 序列,aa 表示氨基酸序列。
序列颜色:不同碱基颜色。
方式类型:bits 表示采用 bits 公式展示不同碱基在最大值为 2 的纵坐标轴中的占比;prob 表示碱基占序列总体碱基的比例,并按占比展示在最大值为 1 的纵坐标轴中。
# D3 词云
简介
词云是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高“关键词”进行可视化。
案例数据分析
载入数据名词和名词频数。
案例统计图形解读
按照名词频数的大小显示其在词云图中的占比。
特殊参数
最小旋转:词条最小顺时针旋转角度
最大旋转:词条最大顺时针旋转角度
字体大小范围:限制词条字体大小
字间距:词条字体间距
# 分组气泡图
特殊参数
min_size: 最小气泡大小
max_size: 组大气泡大小
alpha: 气泡透明度
# 分组比较热图
这个插件提供了一种进行多组比较并使用热图可视化的紧凑方式,以替换绘制许多个箱线图。
当你参考的亚组没有设定时,假设你要比较的一个变量有A、B、C 3组,该插件会为你:
- 比较A和B+C
- 比较B和A+C
- 比较C和A+B
而假设你想要设定参考组为A,那么插件将会
- 比较A和B
- 比较A和C
如果你要比较的是离散变量,该插件只支持2分类,你可以使用 TRUE
/P
表示正例,而 FALSE
/N
表示负例。
# 分组哑铃图
特殊参数
line_size: 线条粗细
dot_size: 两侧圆点大小
# 分组折线图
输入数据分析
通过
names
来区分不同的折线,再通过groups
指定该折线所属的组
# 半小提琴图
简介
半小提琴图是在保留小提琴图右半部分图形的基础上,将左侧部分换成数据频次计数图形,也是用于显示数据分布及概率密度的统计图表。
案例数据分析
载入数据为载入数据为数据集 (不同肿瘤中基因名称及表达水平)。
案例统计图形分析
半小提琴图可以反映数据分布,同箱形图类似,方框中黑色横线显示各肿瘤中基因表达水平的中位数, 白色方框中上下框边代表数据集中的上,下四分位点;左半面可观测数值点的分布状况;小提琴图还可以反映数据密度,数据集数据越集中则图形越胖。图示中 BLGG 组中的基因表达分布更集中,BIC 组次之,AML 组则分布最分散。
# 热图
简介
热图是对实验数据分布情况进行分析的直观可视化方法,可以用来进行实验数据的质量控制和差异数据的具象化展示,还可以对数据和样品进行聚类分析,观测样品质量。
案例数据分析
载入数据为 count (基因名称及其对应的基因表达值),样本信息(样本名称,所属组群及其他相关信息,如年龄),基因信息(基因名称及其所属通路,如肿瘤通路和生理状况下通路)
案例统计图形解读
示例图每个小格表示每个基因,颜色深浅表示该基因表达量大小,表达量越大颜色越深(红色为上调,绿色为下调)。每行表示每个基因在不同样本中的表达量状况,每列表示每个样本所有基因的表达量情况。上方树形图表示不同组群和年龄的不同样本的聚类分析结果,左侧树形图表示来自不同样本的不同基因的聚类分析结果。
特殊参数
热图颜色:更改热图的颜色
# 直方图
简介
直方图是由一系列高度不等的纵向条纹或线段表示连续性变量数据的分布情况。
案例数据分析
载入数据为数据集(不同治疗方案治疗效果数据)。
案例统计图形分析
图中长方形的宽度与组距成正比且可不相同,纵轴代表频数。
特殊参数
Bins:更改矩形的宽度
# 区间区域图
案例数据分析
案例数据为一年十二个月份的最高和最低温度和对应的月份简称
通过案例数据绘制了每个月份的温度区间及温度均线
特殊参数
need_mean_line: 是否需要绘制均值线,如未提供均值数据,默认以最大值+最小值/2为均值
title:标题
x_label: x轴名称
y_label: y轴名称
area_color:区域颜色
mean_line_color:均值线颜色
min_line_color: 最小值线颜色
max_line_color: 最大值线颜色
line_size:线宽度
alpha:区域颜色透明度
max|min|mean_linetype: 线类型
add_line_label: 是否添加折线标签
# 区间条形图
案例数据分析
案例数据为一年十二个月份的最高和最低温度和对应的月份简称
通过案例数据绘制了每个月份的温度区间及温度均线
特殊参数
need_mean_line: 是否需要绘制均值线,如未提供均值数据,默认以最大值+最小值/2为均值 title:标题 x_label: x轴名称 y_label: y轴名称 bar_color:条形颜色 line_color:均值线颜色 line_size:均值线宽度 bar_width:条形宽度,如果为x轴标签为离散值,可在0-1之间调整 alpha:条形图透明度
# 李克特图
简介
对李克特量表带数据进行可视化描述性统计分析## 线图(颜色点)
简介
展示数据点变化。
# 线性回归(误差线)
简介
误差线主要指示数据每一个数据点的误差范围,显示潜在的误差或相对于系列中每一个数据的的不确定程度。
案例数据分析
载入数据为两种分组及其对应的数值。
案例统计图形分析
low 类型中的红色上线表示 treat1 中 low 类型中数值最大值,红色下线表示 treat1 中 low 类型中数值最小值,其他以此类推。分别对treat1 和 treat2 按照 low,mid,high 类型进行秩和检验,显示 P 值于图形上方。
特殊参数
P 值展示形式:value 表示数值,signif 表示"*" 的数量,no表示不展示 P 值
# 线图
简介
线图是指使用线性刻度或对数刻度在二维或三维视图中绘制数据,从而显示数据集或跟踪数据随时间变化的变化特征的统计图表。
案例数据分析
载入数据为横轴数值及其对应的纵轴数值和分组。
案例统计图形分析
图示表明治疗方案一中 value1 值与 value2 值呈正相关,而治疗方案二 value1 值与 value2 值呈负相关。
特殊参数
改变线形:改变不同分组线的形态
添加散点:添加数值对应的点
# 线性回归
简介
线性回归是一种对自变量和因变量之间关系进行线性建模的回归方法。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。
案例数据分析
载入数据为自变量,因变量和分组
案例统计图形解读
不同颜色表示不同分组,可添加线性回归方程,R的平方越接近 1,说明拟合的曲线和实际曲线越趋近。灰色条带代表 95% 置信区间。
特殊参数
添加线性回归方程:添加拟合直线的回归方程和 R 的平方。
# 中国地图 2
简介
中国地图是指在中国地图上展示一组变量在中国境内不同省份的分布情况的统计图表。
案例数据分析
载入数据为中国各省份某变量的分布情况。
案例统计图形解读
图示说明了变量数值在中国境内不同省份的分布情况。颜色越红,则数值越高,颜色越接近于绿,则数值越低。
# 中国地图
简介
中国地图是指在中国地图上展示一组变量在中国境内不同省份的分布情况的统计图表。
案例数据分析
载入数据为中国各省份某变量的分布情况。
案例统计图形解读
图示说明了变量数值在中国境内不同省份的分布情况。颜色越红,则数值越高,颜色越接近于绿,则数值越低。
# 世界地图
简介
世界地图是指在世界地图上展示一组变量在世界不同国家的分布情况的统计图表。
案例数据分析
载入数据为世界各国某变量的分布情况。
案例统计图形解读
图示说明了变量数值在世界不同国家的分布情况。颜色越红,则数值越高,颜色越接近于绿,则数值越低。
# 矩阵气泡图
# 功能介绍
彩色矩阵气泡用于可视化不同细胞(列)中多个基因(行)的表达矩阵数据。
# 数据结构
<1st col>:(String)单元格样本名称作为X轴,
<2nd col>:(String)基因名作为Y轴,
<3rd col>:(数字)基因表达,
[第4列]:(字符串)组。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Panel Space: 细胞多个分组时图像中分组间的间隔距离(默认0)
# 月亮图
简介
月亮图是一种使用月亮的盈缺来反应数据大小的图形。
案例数据分析
载入数据为餐厅名称及各种餐厅内食物种类数,装饰风格种类数,成套餐具种类数和价格种类数。
案例统计图形解读
图示第一行表示餐厅名称,第一列表示餐厅内不同变量,空白月亮表示数目为 1(数目最少),黑色月亮表示数目为 5(数目最多)的数据,随着数据的增多月亮黑色区域逐渐变大,即逐渐变为满月。
# 马赛克比例图
简介
使用马赛克方块展示数据比例
# 多直方图
简介
将多个直方图绘制在同一图像上,可对比多组数据之间的差异
特殊参数
alpha: 直方图颜色透明度
binwidth: 每个柱形的宽度
frame_color: 直方图的边框颜色
# 网路图 (igraph)
简介
基于 igrpah 可视化基础网路图。
数据表
需要输入两个数据表,表 1 为节点信息,包含节点的 ID 和 其余注释信息(用于映射颜色和大小),表 2 为连线信息,包含节点的 ID 以及节点之间的关联信息(用于连接不同节点,并映射连线的宽度信息)
数据表参数
标签列:用于标注节点名称
颜色列:用于映射节点和连线颜色
节点大小列:用于映射节点大小. 如果未设置,将使用节点的连接数代替
标记组列:使用不规则颜色图形将所选类型节点包含
线条宽度列:用于映射连线宽度
特殊参数
布局样式:设置网络图节点和连线的分布样式
线条类型:指定线条类型
节点形状:指定节点形状
变换(大小):用于缩放和变换节点大小列数据
变换(宽度):用于缩放和变换连线宽度列数据
标签距离:控制标签距离其所属图形的距离
# 诺莫图 (逻辑回归)
# 功能介绍
列线图常被用来评价肿瘤和医学的预后,并能直观地反映logistic回归或Cox回归的结果。## 诺莫图
# 功能介绍
列线图常被用来评价肿瘤和医学的预后,并能直观地反映logistic回归或Cox回归的结果。
# 数据结构
随时间变化的生存数据帧,根据实例数据用0,1等数字表示性别和状态。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
# 帕累托图
案例数据分析
案例数据为某商品在多个平台的销量数据
插件会为销量数据自动降序排列绘制条形图,同时计算累积销量绘制累积折线图
# 议会图
简介
议会图是一种形似议会坐席,以点代表一个数据,从而更加灵活地展示各组所占份额比的数据处理方式。
案例数据分析
数据载入为分组及其对应数值。
案例统计图形分析
不同颜色表示不同分组,每一个点代表一个数据。它是由很多点组成半环形,最小的份额在议会图里可以用一个点来表示。
# 主成分分析
简介
主成分分析是以“降维"*" 为核心,用较少的几个综合指标(主成分)代替多指标的数据,还原数据最本质特征的数据处理方式。
案例数据分析
载入数据为数据集(基因名称及其对应的基因表达值)和样本信息(样本名称及分组)
案例统计图形解读
不同颜色表示不同样本,可解读主成分与原变量的关系,如:M1 对 PC1 具有较大的贡献,而 M8 与 PC1 呈较大的负相关性。
# PCAtools
PCAtools 可以通过主成分分析对数据进行降维,并在二维水平查看主成分相关特征。
数据表格 1(数值矩阵):
每一列为一个样本,每一行为一个特征(如基因、芯片探针)
数据表格 2 (样本信息):
第一列为样本名,其他列为该样本的表型特征,可用于标注点的颜色和形状,并与主成分进行相关性分析
数据表格 2 参数列
双标图颜色列(单选) | 用于映射表型特征至双标图将点标注为不同颜色
双标图形状列(单选) | 用于映射表型特征至双标图将点标注为不同形状
关联热图表型列(多选)| 用于绘制表型和主成分的相关性热图
特殊参数:
崖低碎石图主成分数目,散点矩阵图主成分数目,载荷图主成分数目,关联热图主成分数目 均用于控制具体图片上纳入的主成分数目
Top 方差 | 用于过滤纳入的数值矩阵特征
相关性计算方法 | 设置 R
cor
函数的相关性计算方法相关性计算缺失值处理 | 相关性计算过程中缺失值处理方式
崖低碎石图颜色,载荷图低颜色,载荷图中颜色,载荷图高颜色 均用于控制具体图片上的颜色信息
更多详细介绍:PCAtools (opens new window)
# 三维透视图
简介
三维透视图是一种能将一个矩阵中包含的高等数值用曲面连接起来的三维立体图形。
案例数据分析
载入数据为一个矩阵。
案例统计图形分析
清晰观测一个山峰的全貌。
# 3D 饼图
简介
三维饼图是指具有三维外观的饼图。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形分析
该图通过三维形式,更美观的展示了 1 ~ 4 组的样本数量及样本数量所对应的占比。一组样本数量 13,占比 11.71%,二组样本数量 34,占比30.63%,三组样本数量 21,占比 18.92%,四组样本数量 43,占比 38.74%。
特殊参数
直径:圆盘的直径
厚度:圆盘的厚度
水平旋转角度:三维饼图水平旋转的角度
离散度:各分组扇形图的离散程度
# 饼图
简介
饼图是通过将一个圆形切分成多个切片以显示每一部分所占总体比例的统计图表。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形分析
在一个圆图中,每个切片的弧长(其中心角和中心角所对应区域的弧长)与所表示的数量成正比。该饼图展示了 1~4 组分别的样本数量及样本数量所对应的占比。一组样本数量 13,占比 11.71%,二组样本数量 34,占比 30.63%,三组样本数量 21,占比 18.92%,四组样本数量 43,占比38.74%。
# 点图(标准差)
简介
用于展示多组数据点标准差。
# 金字塔图 2
简介
金字塔图是一种将数据分布于中轴两侧类似金字塔的图形。
案例数据分析
载入数据为年龄段,性别分类及前两种变量组合后的人口数目。
案例统计图形解读
图示将年龄段按照顺序从下到上依次显示在中轴线上,左侧表示男性人数,右侧表示女性人数,x 轴表示人口数量,该图可以很明显看出男女在不同年龄段的人数占比情况以及相同性别中不同年龄组的占比情况。
# 金字塔图
简介
金字塔图是一种将数据分布于中轴两侧类似金字塔的图形。
案例数据分析
载入数据为年龄段,性别分类及前两种变量组合后的人口数目。
案例统计图形解读
图示将年龄段按照顺序从下到上依次显示在中轴线上,左侧表示男性人数,右侧表示女性人数,x 轴表示人口数量,该图可以很明显看出男女在不同年龄段的人数占比情况以及相同性别中不同年龄组的占比情况。
特殊参数
排序:no 表示中轴线按照年龄段的顺序排序;desc 表示按照总人口数量进行降序排序;asc 表示按照总人口数量进行升序排序。
# 金字塔堆叠图2
简介
金字塔堆叠图可以用于展示年龄组多变量。
# 金字塔堆叠图
简介
金字塔堆叠图可以用于展示年龄组多变量。
# QQ 图
简介
用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。
# 雷达图
简介
雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据,以直观的表达某个研究对象在多种参数的对比。
案例数据分析
数据载入为数据集 (4 种疾病中 5 个基因的表达水平)。
案例统计图形分析
雷达图每种颜色表示一种疾病,每个点所在的位置表示不同基因表达情况,基因表达值越高,则越远离圆心,反之则越靠近圆心。
# R脚本逻辑可视化
简介
R 脚本逻辑可视化能够实现对 if,else 等逻辑函数进行可视化的窗口。
案例数据分析
载入数据为R语言 if,else 函数代码
案例统计图形解读
图示表示如果变量 x < 10,a = 1,如果变量 x > 10,a = 2;如果 a = 2,则 c = d,如果 a 不等于2,则 d = a。
# 丝带图
简介
丝带图是一种类似丝带的图形。
案例数据分析
载入数据为 x 轴数值及其对应的两个 y 轴数值和分组。
案例统计图形分析
每种颜色表示不同的分组,可以透过其中折线,观测每组数据随时间的变化。
# 岭图
简介
岭图是一种将点连接围成形似山岭的图形。
案例数据分析
载入数据为三种分组及其对应的数值。
案例统计图形分析
不同颜色表示不同分组,可以观测数据大致的高低程度。
# ROC 曲线
简介
接收者工作特征曲线(ROC 曲线)是用来说明二元分类器系统在其识别阈值变化时诊断能力的图形。
案例数据分析
示例数据为一列二分类变量的结局和三列不同变量(诊断指标)及其数值。
案例统计图形解读
横轴表示特异性,纵轴表示敏感性,二者之间没有函数关系。曲线越靠近左上角,认为该诊断指标预测能力越好。图示中每种颜色表示一个变量(诊断指标),蓝色曲线和红色曲线的预测能力明显较绿色曲线好。AUC 为 ROC 曲线下面积。AUC = 1 表示该曲线存在至少一个阈值能得出完美预测。0.5 < AUC < 1,优于随机猜测,妥善选择阈值,能有预测价值。AUC = 0.5,跟随机猜测一样,模型没有预测价值。若 AUC < 0.5,可能原因是二分类变量如(0,1)与结局设置颠倒,调换结局赋值即可。在本图示中,value-Am (86.9792) > value-GG (84.3750) > value-EL (56.7708),可以认为 Am 变量的预测能力最好。
特殊参数
置信区间:shape 表示画一个有颜色区域的置信区间,bars 表示画一个由竖条构成的置信区间,no 表示不绘制置信区间。
绘制平滑的 ROC 曲线:使呈阶梯样图变成一条圆滑的曲线。
进行模型评估:未知
进行模型比较:未知
# 玫瑰图
- 简介
玫瑰图是一种在极坐标下绘制的柱形图,使用圆弧的半径长短表示数据的大小。
- 案例数据分析
载入数据为分为三列,第一列是样本名称,第二列为分组,第三列为样本对应的数值。
- 案例统计图形解读
案例数据中是使用scRNA-Seq对人类不同器官进行测序后,得到的不同器官上下调基因的分布情况。## 桑基图
简介
桑基图是一种流量图,其中箭头的宽度与流量成比例。
案例数据分析
载入数据为 4 个变量及每4种变量组合下的频数。
案例统计图形解读
female 分流的颜色为蓝色,male 分流的颜色为红色,蓝色分流出去的宽度和等于 female 的总宽度。
特殊参数
丝带颜色列:设置需要分流颜色的类型
# 散点图2
简介
二维空间散点展示多数值变量关系。
# 3D 散点图
简介
三维散点图是将多个定量变量运用于空间中的不同轴上,并将不同的变量组合成空间中的坐标,从而对三个定量变量的交互关系进行清晰的解释。
案例数据分析
载入数据为三个变量和分组。
案例统计图形分析
图中分别将温度、压力、时间放置在 x(水平轴)、y(垂直轴)、z(透视轴)上,生成一幅三维散点图,直观发现三者变量间的相关关系及相关强弱程度。
特殊参数
俯仰角:正值越大,表示趋于从三维图形顶端向下观测;负值越大,表示趋于从三维图形底端向上观测。
水平旋转角度:三维图形水平旋转的角度
# 渐变散点图
简介
二维空间散点展示多数值变量关系。
# 散点饼图
散点饼图用于可视化不同空间坐标中数据分类值的比例情况。
目前,这个插件实现了 R 包 scatterpie (opens new window) 的一个简单接口。
输入的数据表格至少需要 3 列。前面两列对应这平面坐标值,而其他更多的列则用于表示不同分类下的数据值。如果你了解长宽格式,你也可以设定输入长格式的数据(默认识别为宽格式)。
# 散点图
简介
用两组数据构成多个坐标点,通过观察坐标点的分布,判断变量间是否存在关联或总结坐标点分布模式的数据处理方式。
案例数据分析
载入数据为横轴数值及其对应的纵轴数值和分组。
案例统计图形分析
Value1 表示横轴,Value2 表示纵轴,图示表示治疗方案一中 Value1 与 Value2 两个变量呈正相关: 即 Value1 变大时, Value2 随之变大; 治疗方案二中两个变量则呈负相关: 即 Value1 变大时,Value2 随之变小。
特殊参数
改变点形状:不同分组有不同点的形状
# 简单漏斗图
案例数据分析
某购物网站共有60浏览量,30点击数,20人购买,通过数据绘制漏斗图
表格数据说明
第一行为两个参数名,
key
和value
,请勿修改,分别为数据标签及对应值往下各行为具体数据
特殊参数
theme:绘图主题
# 斜面图
- Introduction
斜面图可以用于展示数值变化情况。
# 百分比堆叠条形图
案例数据分析
案例数据为某商场中三种商品在一星期内的销量,销量数据会被自动计算为百分比的形式进行绘图
数据表
第一列为纵坐标名称,其余各列默认为绘图数据
特殊参数
title:标题
x_label:x轴名称
y_label:y轴名称
add_percent_label:是否在图像上添加百分比标签
# 堆叠小提琴图
# 功能介绍
单细胞转录组(single cell RNA-Seq)分析中每个簇关键基因的表达。
# 数据结构
基因表达矩阵。单细胞转录组分析中所有细胞和组的基因表达矩阵(单细胞RNA序列)。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Y Axis Text Angle: Y轴文本的角度
# 生存曲线
简介
生存曲线是显示特定物种或群体 (如雄性或雌性) 在每个年龄存活下来的个体数量或比例的图表。
案例数据分析
载入数据为时间点,生存状态及分组。
案例统计图形解读
横轴表示时间轴,纵轴表示生存概率。蓝色曲线表示 G1 组生存曲线,红色曲线表示 G2 组生存曲线。经过 logrank 检验后发现 P 值 = 0.0013 < 0.05,表明两组患者生存状况的差异不能用抽样误差来解释,分组因素才是导致两条曲线生存率出现差异的原因。该示例图形表明,G2 组的总体生存率要好于 G1 组。
# 泰勒图
简介
可以用于同时展示模型标准差(standard deviation, SD)、均方根(root mean square,RMS)误差和相关系数。
# 时间相关的ROC分析
# 功能介绍
生存分析中受试者操作特征(ROC)与时间记录分析。
# 数据结构
<表1>:(数字)生存数据(即生存,风险)。
<表2>:(数字)时间数据。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Time Unit: 时间单位,可选年、月、日
Annotation Text Location(X): 注释在X轴对应的位置
Annotation Text Location(Y): 注释在Y轴对应的位置
# 热图决策树
简介
热图决策图是一种拼接热图和决策树可视化即决策图两种图形的一种可视化图形。
案例数据分析
第一列为物种种类名称,第二列为岛屿,其余列为物种特征。
案例统计图形解读
图示上半个图为决策图,下半个图为热图。
决策图:最上层 island 对 species 分类影响最大,根据不同条件最终可以归为不同 species。
热图:可以观测出每个物种每种条件下量的变化。
图例:对于每种分类变量而言,不同颜色表示不同种类;对于连续性变量而言,数值越高颜色越浅,反之,越深。
特殊参数
展示图形:heat-tree:绘制热图决策树图;heat-only: 仅绘制热图;tree-only: 仅绘制决策树图。
热图相对大小:0 表示没有热图;1 表示仅有热图。即相对于整个热图决策树图,热图高度所占比。
图形间距:热图和决策树图的间距。
相对水平权重:子节点位置相对于其子级的相对权重通常为 1 到 1.5。父节点完全位于子节点中间时为 1。
叶节点聚类:在每个叶节点内的样本的分层聚类中包含目标/标签,可能会产生更易解释的热图。
样本聚类:在每个叶节点内的样本之间执行层次聚类。
连续变量图例:是否展示热图连续变量颜色图例。
分类变量图例:是否展示热图分类变量颜色图例。
# 树形图
简介
树形图是一种用图形形式来表示层次结构的树形结构图。
案例数据分析
载入数据为不同分组及其数据。
案例统计图形解读
不同颜色表示不同组群 ,不同面积表示数据及占比。
特殊参数
将标签的大小和方框大小关联:将标签的大小与方框大小比例相关联。
# 三色直方图
简介
通过三种颜色将直方图分为低值区,中值区和高值区
特殊参数
left_color
:低值区颜色middle_color
:中值区颜色right_color
:高值区颜色alpha
:透明度binwidth
:柱形宽度low_value
:低值high_value
:高值
# t-SNE
简介
t-SNE 是一种非线性降维算法,适用于高维数据降维到 2 维或 3 维并进行可视化。该算法能够使较大相似度的点,t 分布在低维空间中的距离更近;而对于低相似度的点,t 分布在低维空间中的距离更远。
案例数据分析
载入数据为数据集(基因名称及其对应的基因表达值)和样本信息(样本名称及分组)
案例统计图形解读
不同颜色表示不同样本,与 PCA(主成分分析)图形解释相同,不同之处在于可视化效果,t-SNE 中对于不相似的点,用一个较小的距离会产生较大的梯度来让这些点排斥开来。
特殊参数
Perplexity:
水平旋转角度:
# UMAP
简介
UMAP 是一种非线性降维算法,适用于高维数据降维到 2 维或 3 维并进行可视化。该算法能够使较大相似度的点,t 分布在低维空间中的距离更近;而对于低相似度的点,t 分布在低维空间中的距离更远。
案例数据分析
载入数据为数据集(基因名称及其对应的基因表达值)和样本信息(样本名称及分组)
案例统计图形解读
不同颜色表示不同样本,与 PCA(主成分分析)图形解释相同,不同之处在于可视化效果,t-SNE 中对于不相似的点,用一个较小的距离会产生较大的梯度来让这些点排斥开来。
特殊参数
# Upset
简介
Upset 可用于展示集合之间的交互关系。
数据表格
数据表可输入两种类型:list 和 binary。其中 list 格式为每列为一个集合,并包含所有集合对应的元素。binary 格式第一列为全部集合的全部元素,后续列为 0 和 1 组成的数值矩阵,1 则表明对应行元素存在于某个集合,0 则表示不存在。
特殊参数
集合柱状图标签 | 集合柱状图(左侧)坐标轴标签
组合柱状图标签 | 组合柱状图(顶部)坐标轴标签
数据类型 | list 和 binary。参数介绍同数据表格。
模式 | 参考 https://jokergoo.github.io/ComplexHeatmap-reference/book/upset-plot.html#upset-mode
集合重排序 | 对集合柱状图(左侧)进行排序
组合重排序 | 对组合柱状图(顶部)进行排序
点大小 | 设置点的大小
线宽 | 设置线的宽度
集合柱状图 | 设置集合柱状图(左侧)颜色
组合柱状图 | 设置组合柱状图(顶部)颜色
点线 | 设置点线颜色
背景矩形 | 背景矩形颜色
未选中点 | 未选中点颜色
# 韦恩图2
简介
维恩图是一种表示不同有限集合之间所有可能的逻辑关系的图。这些图将集合内元素描述为平面上的点,将集合描述为封闭曲线内的区域。维恩图由多个重叠的闭合曲线 (通常是圆) 组成,每个曲线代表一个集合。标记为S曲线内的点表示集合 S 中的元素,而边界外的点表示集合 S 中不存在的元素。例如,两个集合中的所有元素的交集,S∩T,在视觉上用集合 S 和 T 的重叠区域来表示。在维恩图中,曲线以各种可能的方式重叠,显示了集合之间所有可能的关系。
案例数据分析
载入数据为 5 个含有基因名称的集合。
案例统计图形解读
5 种颜色的闭合曲线代表 5 个集合,数字表示多个集合重叠或者未重叠的基因数,例如:示例图中 8 代表 5 个示例集合中均含有 8 个相同的基因名称。
# 韦恩图
简介
维恩图是一种表示不同有限集合之间所有可能的逻辑关系的图。这些图将集合内元素描述为平面上的点,将集合描述为封闭曲线内的区域。维恩图由多个重叠的闭合曲线 (通常是圆) 组成,每个曲线代表一个集合。标记为S曲线内的点表示集合 S 中的元素,而边界外的点表示集合 S 中不存在的元素。例如,两个集合中的所有元素的交集,S∩T,在视觉上用集合 S 和 T 的重叠区域来表示。在维恩图中,曲线以各种可能的方式重叠,显示了集合之间所有可能的关系。
案例数据分析
载入数据为 5 个含有基因名称的集合。
案例统计图形解读
5 种颜色的闭合曲线代表 5 个集合,数字表示多个集合重叠或者未重叠的基因数,例如:示例图中 8 代表 5 个示例集合中均含有 8 个相同的基因名称。
# 分组小提琴图
# 功能介绍
T检验分组数据的小提琴图和盒图。
# 数据结构
数据帧
<1st col>:(数字)值数据,
<2nd col>:(String)第1列组,
<3rd col>:(字符串)第2列组。
# 参数详解
主要参数
Title: 图像的主标题(部分图像可替换默认标题)
Theme: 图像主题(由ggplot2提供的主题)
Color Palette: 图像配色(由ggsci提供的主流期刊优秀配色)
Font Family: 字体(如主流期刊规定的Time New Romas)
Width: 输出图像的宽度(默认为英寸如标准为12 x 7 inch)
Height: 输出图像的高度(默认为英寸如标准为12 x 7 inch)
Alpha: 元素的透明度(0-1,0表示透明,1表示不透明)
重要参数
Legend Position: 图例在图像中的位置
Legend Direction: 图例中多个元素的排列方式(横向或纵向)
Legend Title Size: 图例主标题大小
Legend Text Size: 图例中元素文本的大小
Axis Title Size: 图像坐标轴标题的大小
Axis Font Size: 图像坐标轴刻度字体的大小
Axis Text Angle: 图像坐标轴文本的角度
Axis Adjust: 图像坐标轴文本的距离(微调)
特殊参数
Add Geom: 在小提琴图上添加箱线图展示更加丰富的信息
Stat Method: 置信度统计的方法(默认为T-test)
# 小提琴图
简介
小提琴图,因形似小提琴而得名,是结合了箱形图和核密度图,用于显示数据分布及概率密度的统计图表。
案例数据分析
载入数据为数据集 (不同肿瘤中基因名称及表达水平)。
案例统计图形分析
小提琴图可以反映数据分布,同箱形图类似,方框中黑色横线显示各肿瘤中基因表达水平的中位数, 白色方框中上下框边代表数据集中的上,下四分位点;小提琴图还可以反映数据密度,数据集数据越集中则图形越胖。图示中BLGG 组中的基因表达分布更集中,BIC 组次之,AML组则分布最分散。
特殊参数
P 值展示形式:value 表示数值,signif 表示"*" 的数量,no 表示不展示 P 值
添加箱线图:在小提琴内部放置一个箱线图
# 火山图
简介
火山图是一种直观展示两个样本间基因差异表达的分布图。
案例数据分析
载入数据为基因名称及其对应的 logFC 和 p.value。
案例统计图形解读
横轴用 log2(fold change)表示,差异越大的基因分布在图片两端。纵坐标用 -log10(p.value)表示,取值为 T 检验显著性 P 值的负对数。蓝色的点代表下调的基因,红色的点代表上调的基因,灰色的点代表差异不显著的基因。
特殊参数
P 值阈值:更改横向虚线轴
Log2FoldChange 阈值:更改纵向虚线轴
展示 Top 基因:标注上调或者下调的基因名称
# 瀑布图 2
- 简介
用于展示数据的变化情况,区别于1的一点是2可以自定义上升值和下降值颜色
特殊参数
calc_total: 是否计算数据总和
width: 条带宽度
up_color: 上升值颜色
down_color: 下降值颜色
total_color: 总和颜色