Matplotlib和Seaborn演示Python可视化
阅读原文时间:2023年07月08日阅读:1

数据可视化就是使用图形图表等方式来呈现数据,图形图表能够高效清晰地表达数据包含的信息。

Seaborn是基于matplotlib,在matplotlib的基础上进行了更高级的API封装,便于用户可以更加简便地做出各种有吸引力的统计图表。

可以说,seaborn是matplotlib的很好补充,而且能够高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。

安装:pip install seaborn

seaborn的主要功能有:

  • 内置主题
  • 丰富的调色板,更好的显示数据信息
  • 对变量分布进行了可视化
  • 数据矩阵可视化,并使用聚类算法发现这些矩阵中的结构
  • 对自变量和因变量之间的线性回归结果进行可视化
  • 绘制统计时间序列,并将其不确定性可视化
  • 构建高级、抽象的网格图,可轻松将复杂问题可视化

Seaborn是一个在Python中制作有吸引力和信息丰富的统计图形的库。它建立在matplotlib之上,并与PyData堆栈紧密集成,包括支持来自scipystatsmodels的numpypandas数据结构和统计例程。 Seaborn旨在将可视化作为探索和理解数据的核心部分。绘图函数对包含整个数据集的数据框和数组进行操作,并在内部执行必要的聚合和统计模型拟合以生成信息图。如果matplotlib“试图让事情变得简单容易和难以实现”,seaborn会试图使一套明确的方案让事情变得容易。 Seaborn可以认为是对matplotlib的补充,而不是它的替代品。在数据可视化方面能够很好的表现。

分类统计图

(1)统计柱状图barplot(均值和置信区间)
(2)灰度柱状图countplot
(3)点图pointplot(均值和置信区间)

分类散点图
当有一维数据是分类数据时,散点图成为了条带形状:
(1)航线图stripplot,设置参数添加抖动方法jitter=True(点的直接展示)
(2)生成蜂群图swarmplot,避免散点重叠(点的直接展示)

分类分布图
(1)箱式图boxplot:上下边缘、上下四分位数、中位数(近似分布)
(2.1)提琴图violinplot:箱式图 + KDE((近似分布))
(2.2)非对称提琴图:violinplot里的split=True参数

分类统计子图
(1)单分类标准的子图factorplot
(2)多分类标准的子图PairGrid

矩阵图