1
使用pip安装
使用 Python 包管理器 pip 来安装 Matplotlib 是一种最轻量级的方式。打开 CMD 命令提示符窗口,并输入以下命令:
pip install matplotlib
2
atplotlib 中的 pyplot 模块是一个类似命令风格的函数集合,这使得 Matplotlib 的工作模式和 MATLAB 相似。
pyplot 模块提供了可以用来绘图的各种函数,比如创建一个画布,在画布中创建一个绘图区域,或是在绘图区域添加一些线、标签等。以下表格对这些函数做了简单地介绍。
绘图类型
函数名称
描述
Bar
绘制条形图
Barh
绘制水平条形图
Boxplot
绘制箱型图
Hist
绘制直方图
his2d
绘制2D直方图
Pie
绘制饼状图
Plot
在坐标轴上画线或者标记
Polar
绘制极坐标图
Scatter
绘制x与y的散点图
Stackplot
绘制堆叠图
Stem
用来绘制二维离散数据绘制(又称为“火柴图”)
Step
绘制阶梯图
Quiver
绘制一个二维按箭头
图像函数
函数名称
描述
Imread
从文件中读取图像的数据并形成数组。
Imsave
将数组另存为图像文件。
Imshow
在数轴区域内显示图像。
Axis函数
函数名称
描述
Axes
在画布(Figure)中添加轴
Text
向轴添加文本
Title
设置当前轴的标题
Xlabel
设置x轴标签
Xlim
获取或者设置x轴区间大小
Xscale
设置x轴缩放比例
Xticks
获取或设置x轴刻标和相应标签
Ylabel
设置y轴的标签
Ylim
获取或设置y轴的区间大小
Yscale
设置y轴的缩放比例
Yticks
获取或设置y轴的刻标和相应标签
Figure函数
函数名称
描述
Figtext
在画布上添加文本
Figure
创建一个新画布
Show
显示数字
Savefig
保存当前画布
Close
关闭画布窗口
3绘制曲线图
PyLab 是一个面向 Matplotlib 的绘图库接口,其语法和 MATLAB 十分相近。它和 Pyplot 模快都够实现 Matplotlib 的绘图功能。PyLab 是一个单独的模块,随 Matplotlib 软件包一起安装,该模块的导包方式和 Pyplot 不同,如下所示:
PyLab 是一个很便捷的模块,下面对它的使用方法做相应的介绍。
提供一对相同长度的数组(或序列),然后使用plot()绘制曲线,示例如下:
输出结果:
图1:绘制曲线图
如果您要绘制特殊类型的线条,并想添加一些颜色,PyLab 提供了如下方法:
符号
'-','--','-.',':','.',',',,o,^,v,<,>,s,+,x,D,d,1,2,3,4,h,H,p,| ,_
颜色
b(蓝色),g(绿色),r(红色),c(青色),m(品红),y(黄色),k(黑色),w(白色)
使用示例如下:
输出结果:
图2:红点曲线图
如果您想在同一绘图区域内绘制多个图形,只需要使用多个绘图命令。示例如下:
输出结果:
图3:绘制多条不同曲线
如果您想清除图像,直接在程序末尾调用 clf() 方法即可。
4Matplotlib figure图形对象
在 Matplotlib 中,面向对象编程的核心思想是创建图形对象(figure object)。通过图形对象来调用其它的方法和属性,这样有助于我们更好地处理多个画布。在这个过程中,pyplot 负责生成图形对象,并通过该对象来添加一个或多个 axes 对象(即绘图区域)。
Matplotlib 提供了matplotlib.figure图形类模块,它包含了创建图形对象的方法。通过调用 pyplot 模块中 figure() 函数来实例化 figure 对象。如下所示:
该函数的参数值,如下所示:
参数
说明
figsize
指定画布的大小,(宽度,高度),单位为英寸。
dpi
指定绘图对象的分辨率,即每英寸多少个像素,默认值为80。
facecolor
背景颜色。
dgecolor
边框颜色。
frameon
是否显示边框。
下面使用 figure() 创建一个空白画布:
fig = plt.figure()
我们使用 add_axes() 将 axes 轴域添加到画布中。如下所示:
ax=fig.add_axes([0,0,1,1])
add_axes() 的参数值是一个序列,序列中的 4 个数字分别对应图形的左侧,底部,宽度,和高度,且每个数字必须介于 0 到 1 之间。
设置 x 和 y 轴的标签以及标题,如下所示:
调用 axes 对象的 plot() 方法,对 x 、 y 数组进行绘图操作:
ax.plot(x,y)
完整的代码如下所示:
输出结果如下:
图1:运行结果图
在 Jupyter Notebook 中运行程序,结果如下:
图2:运行结果
5sxes使用
Matplotlib 定义了一个 axes 类(轴域类),该类的对象被称为 axes 对象(即轴域对象),它指定了一个有数值范围限制的绘图区域。在一个给定的画布(figure)中可以包含多个 axes 对象,但是同一个 axes 对象只能在一个画布中使用。
2D 绘图区域(axes)包含两个轴(axis)对象;如果是 3D 绘图区域,则包含三个。
通过调用 add_axes() 方法能够将 axes 对象添加到画布中,该方法用来生成一个 axes 轴域对象,对象的位置由参数rect决定。
rect 是位置参数,接受一个由 4 个元素组成的浮点数列表,形如 [left, bottom, width, height] ,它表示添加到画布中的矩形区域的左下角坐标(x, y),以及宽度和高度。如下所示:
ax=fig.add_axes([0.1,0.1,0.8,0.8])
注意:每个元素的值是画布宽度和高度的分数。即将画布的宽、高作为 1 个单位。比如,[ 0.1, 0.1, 0.8, 0.8],它代表着从画布 10% 的位置开始绘制, 宽高是画布的 80%。
下面介绍 axes 类的其他成员函数,这些函数在绘图过程中都承担着不同的作用。
axes 类的 legend() 方法负责绘制画布中的图例,它需要三个参数,如下所示:
ax.legend(handles, labels, loc)
下面是 loc 参数的表示方法,分为字符串和整数两种,如下所示:
位置
字符串表示
整数数字表示
自适应
Best
0
右上方
upper right
1
左上方
upper left
2
左下
lower left
3
右下
lower right
4
右侧
right
5
居中靠左
center left
6
居中靠右
center right
7
底部居中
lower center
8
上部居中
upper center
9
中部
center
10
这是 axes 类的基本方法,它将一个数组的值与另一个数组的值绘制成线或标记,plot() 方法具有可选格式的字符串参数,用来指定线型、标记颜色、样式以及大小。
颜色代码如下表:
'b'
蓝色
'g'
绿色
'r'
红色
'c'
青色
'm'
品红色
'y'
黄色
'k'
黑色
'w'
白色
标记符号如下表:
标记符号
描述
'.'
点标记
'o'
圆圈标记
'x'
'X'标记
'D'
钻石标记
'H'
六角标记
's'
正方形标记
'+'
加号标记
线型表示字符,如下表:
字符
描述
'-'
实线
'--'
虚线
'-.'
点划线
':'
虚线
'H'
六角标记
下面的例子,以直线图的形式展示了电视、智能手机广告费与其所带来产品销量的关系图。其中描述电视的是带有黄色和方形标记的实线,而代表智能手机的则是绿色和圆形标记的虚线。
输出结果如下:
图1:输出结果
6subplot
在使用 Matplotlib 绘图时,我们大多数情况下,需要将一张画布划分为若干个子区域,之后,我们就可以在这些区域上绘制不用的图形。在本节,我们将学习如何在同一画布上绘制多个子图。
matplotlib.pyplot模块提供了一个 subplot() 函数,它可以均等地划分画布,该函数的参数格式如下:
plt.subplot(nrows, ncols, index)
nrows 与 ncols 表示要划分几行几列的子区域(nrows*nclos表示子图数量),index 的初始值为1,用来选定具体的某个子区域。
例如: subplot(233)表示在当前画布的右上角创建一个两行三列的绘图区域(如下图所示),同时,选择在第 3 个位置绘制子图。
图1:示意图
如果新建的子图与现有的子图重叠,那么重叠部分的子图将会被自动删除,因为它们不可以共享绘图区域。
上述代码运行结果,如下图所示:
图2:subplot绘制结果
如果不想覆盖之前的图,需要使用 add_subplot() 函数,代码如下:
执行上述代码,输出结果如下:
图3:add_subplot()绘图结果
通过给画布添加 axes 对象可以实现在同一画布中插入另外的图像。
输出结果如下:
图4:输出结果图
7subplots
matplotlib.pyplot模块提供了一个 subplots() 函数,它的使用方法和 subplot() 函数类似。其不同之处在于,subplots() 既创建了一个包含子图区域的画布,又创建了一个 figure 图形对象,而 subplot() 只是创建一个包含子图区域的画布。
subplots 的函数格式如下:
fig , ax = plt.subplots(nrows, ncols)
nrows 与 ncols 表示两个整数参数,它们指定子图所占的行数、列数。
函数的返回值是一个元组,包括一个图形对象和所有的 axes 对象。其中 axes 对象的数量等于 nrows * ncols,且每个 axes 对象均可通过索引值访问(从1开始)。
下面我们创建了一个 2 行 2 列的子图,并在每个子图中显示 4 个不同的图像。
上述代码的输出结果如下:
图1:输出结果
matplotlib.pyplot 模块提供了 subplot2grid() ,该函数能够在画布的特定位置创建 axes 对象(即绘图区域)。不仅如此,它还可以使用不同数量的行、列来创建跨度不同的绘图区域。与 subplot() 和 subplots() 函数不同,subplot2gird() 函数以非等分的形式对画布进行切分,并按照绘图区域的大小来展示最终绘图结果。
函数语法格式如下:
plt.subplot2grid(shape, location, rowspan, colspan)
参数含义如下:
下面,在画布(figure)中添加了行、列跨度均不相同的绘图子区域,然后在每个绘图区上,绘制不同的图形。示例代码如下:
输出结果如下:
图1:subplot2grid()输出结果
9matplotlib.pyplot 模块提供了 subplot2grid() ,该函数能够在画布的特定位置创建 axes 对象(即绘图区域)。不仅如此,它还可以使用不同数量的行、列来创建跨度不同的绘图区域。与 subplot() 和 subplots() 函数不同,subplot2gird() 函数以非等分的形式对画布进行切分,并按照绘图区域的大小来展示最终绘图结果。
函数语法格式如下:
plt.subplot2grid(shape, location, rowspan, colspan)
参数含义如下:
下面,在画布(figure)中添加了行、列跨度均不相同的绘图子区域,然后在每个绘图区上,绘制不同的图形。示例代码如下:
输出结果如下:
图1:subplot2grid()输出结果
10grid介绍
通过 Matplotlib axes 对象提供的 grid() 方法可以开启或者关闭画布中的网格(即是否显示网格)以及网格的主/次刻度。除此之外,grid() 函数还可以设置网格的颜色、线型以及线宽等属性。
grid() 的函数使用格式如下:
grid(color='b', ls = '-.', lw = 0.25)
参数含义如下:
网格在默认状态下是关闭的,通过调用上述函数,网格会被自动开启,如果您只是想开启不带任何样式的网格,可以通过 grid(True) 来实现。
实例如下:
上述代码执行后,输出结果:
11设置坐标轴格式
在一个函数图像中,有时自变量 x 与因变量 y 是指数对应关系,这时需要将坐标轴刻度设置为对数刻度。Matplotlib 通过 axes 对象的xscale或yscale属性来实现对坐标轴的格式设置。
示例:右侧的子图显示对数刻度,左侧子图则显示标量刻度。
图1:对数关系图
轴是连接刻度的线,也就是绘图区域的边界,在绘图区域(axes 对象)的顶部、底部、左侧和右侧都有一个边界线(轴)。通过指定轴的颜色和宽度,从而对进行显示格式设置,比如将所有轴的颜色设置为 None,那么它们都会成为隐藏状态,或者也可以给轴添加相应的颜色。以下示例为左侧轴、底部轴分别设置了红色、蓝色,如下所示:
13坐标范围
Matplotlib 可以根据自变量与因变量的取值范围,自动设置 x 轴与 y 轴的数值大小。当然,您也可以用自定义的方式,通过 set_xlim() 和 set_ylim() 对 x、y 轴的数值范围进行设置。
当对 3D 图像进行设置的时,会增加一个 z 轴,此时使用 set_zlim() 可以对 z 轴进行设置。
下面示例分别对自动设置和自定义设置做了演示:第一种 Matplotlib 自动设置
代码执行后,输出结果如下:
图2:输出结果
图1:输出结果
第二种:自定义设置,set_xlim() 将 x 轴的数值范围设置为(0到10); set_ylim() 将 y 轴的范围设置为(0到10000)。
输出结果如下:
图2
刻度指的是轴上数据点的标记,Matplotlib 能够自动的在 x 、y 轴上绘制出刻度。这一功能的实现得益于 Matplotlib 内置的刻度定位器和格式化器(两个内建类)。在大多数情况下,这两个内建类完全能够满足我们的绘图需求,但是在某些情况下,刻度标签或刻度也需要满足特定的要求,比如将刻度设置为“英文数字形式”或者“大写阿拉伯数字”,此时就需要对它们重新设置。
xticks() 和 yticks() 函数接受一个列表对象作为参数,列表中的元素表示对应数轴上要显示的刻度。如下所示:
ax.set_xticks([2,4,6,8,10])
x 轴上的刻度标记,依次为 2,4,6,8,10。您也可以分别通过 set_xticklabels() 和 set_yticklabels() 函数设置与刻度线相对应的刻度标签。
下面示例对刻度和标签的使用方法做了说明。
输出结果如下:
当不对 Matplotlib 进行设置,而直接使用中文时,绘制的图像会出现中文乱码。下面是一个含有中文乱码的折线图:
从上图可以看出,本应该显示在红框内的中文字体没有显示出来(红框是自己标注出来的),下面给出了两种解决方案:第一种是临时解决方案,第二种是一劳永逸的解决方案。
通过临时重写配置文件的方法,可以解决 Matplotlib 显示中文乱码的问题,代码如下所示:
将上述代码添加到您的绘图程序中,即可解决中文乱码的问题。这是一种非常灵活、便捷的解决方法。完整的程序代码如下:
输出结果如下:
不过上述解决方案适用于所有操作系统,其唯一弊端是每编写一个绘图程序就要添加一次相同的代码。
下面介绍第二种方式:通过直接修改配置文件的方法,可以一劳永逸的解决 Matplotlib 的中文乱码问题。注意此过程在 Windows 环境下进行。
Matplotlib 从配置文件 matplotlibrc 中读取相关配置信息,比如字体、样式等,因此我们需要对该配置文件进行更改。首先查看 matplotlibrc 所在的目录,使用如下代码确定目录位置:
输出结果:
D:\python\python37\lib\site-packages\matplotlib\mpl-data\matplotlibrc
然后修改配置文件 matplotlibrc。打开配置文件后,找到以下信息:
#font.family: sans-serif
#font.serif: DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif
将上述配置项前面的#去掉,并修改的配置项,如下所示:
font.family : Microsoft YaHei, sans-serif
font.serif: Microsoft YaHei, DejaVu Serif, Bitstream Vera Serif, Computer Modern Roman, New Century Schoolbook, Century Schoolbook L, Utopia, ITC Bookman, Bookman, Nimbus Roman No9 L, Times New Roman, Times, Palatino, Charter, serif
注意,由于版本问题,上述内容配置信息可能存在一些差异,请自动忽略。
最后,在以下目录中复制中文字体微软雅黑:
C:\Windows\Fonts\Microsoft YaHei UI
复制完成后,将字体粘贴至以下路径文件中:
D:\python\python37\lib\site-packages\matplotlib\mpl-data\fonts\ttf
字体粘贴后会出现一个 MSYH.ttc 的字体文件,如下所示:
编写如下代码进行测试:
输出结果如下:
16双轴图
在一些应用场景中,有时需要绘制两个 x 轴或两个 y 轴,这样可以更直观地显现图像,从而获取更有效的数据。Matplotlib 提供的 twinx() 和 twiny() 函数,除了可以实现绘制双轴的功能外,还可以使用不同的单位来绘制曲线,比如一个轴绘制对函数,另外一个轴绘制指数函数。
下面示例绘制了一个具有两个 y 轴的图形,一个显示指数函数 exp(x),另一个显示对数函数 log(x)。
输出结果:
图1:输出结果
17柱状图
柱状图是一种用矩形柱来表示数据分类的图表,柱状图可以垂直绘制,也可以水平绘制,它的高度与其所表示的数值成正比关系。柱状图显示了不同类别之间的比较关系,图表的水平轴 X 指定被比较的类别,垂直轴 Y 则表示具体的类别值。
Matplotlib 提供了bar()函数来绘制柱状图,它可以应用在 MATLAB 样式以及面向对象的绘图方法中。当它与 axes 对象一起使用时,其语法格式如下:
ax.bar(x, height, width, bottom, align)
该函数的参数说明,如下表所示:
bar()函数参数说明
x
一个标量序列,代表柱状图的x坐标,默认x取值是每个柱状图所在的中点位置,或者也可以是柱状图左侧边缘位置。
height
一个标量或者是标量序列,代表柱状图的高度。
width
可选参数,标量或类数组,柱状图的默认宽度值为 0.8。
bottom
可选参数,标量或类数组,柱状图的y坐标默认为None。
algin
有两个可选项 {"center","edge"},默认为 'center',该参数决定 x 值位于柱状图的位置。
该函数的返回值是一个 Matplotlib 容器对象,该对象包含了所有柱状图。
下面是一个关于 Matplotlib 柱状图的简单示例。它用来显示了不同编程语言的学习人数。
输出结果如下:
图1:matplotlib bar()绘图
通过调整柱状图的宽度,可以实现在同一 x 轴位置绘制多个柱状图。您可以将它们设置成不同的颜色,从而使它们更容易区分。下面示例描述了某工程学院过去四年中,三个专业录取的统招学生数量。
上述代码执行后,将显示四个柱状图,将每个柱状图又均分为三个小柱状图,每个柱状图占据 0.25 个单位。
图2:matplotlib绘图
柱状图除了上述使用方法外,还有另外一种堆叠柱状图。所谓堆叠柱状图就是将不同数组别的柱状图堆叠在一起,堆叠后的柱状图高度显示了两者相加的结果值。
bar() 函数提供了一个可选参数bottom,该参数可以指定柱状图开始堆叠的起始值,一般从底部柱状图的最大值开始,依次类推。
下面是一个不同国家参加奥林匹克运动会所得奖牌(金银铜)的柱状堆叠图示例,如下所示:
在上述代码中,第一次调用plt.bar()绘制了黄色柱状图, 第二次调用plot.bar()时绘制了灰色柱状图,最后一次调用plt.bar()则绘制最底部的柱状图。两个柱状图相接触的位置就是顶部与底部的位置,这样就构成了柱状堆叠图。
图3:柱状堆叠图
18直方图
直方图(Histogram),又称质量分布图,它是一种条形图的一种,由一系列高度不等的纵向线段来表示数据分布的情况。 直方图的横轴表示数据类型,纵轴表示分布情况。
首先,我们需要了解柱状图和直方图的区别。直方图用于概率分布,它显示了一组数值序列在给定的数值范围内出现的概率;而柱状图则用于展示各个类别的频数。
例如,我们对某工厂的员工年龄做直方图统计,首先我们要统计出每一位员工的年龄,然后设定一个 20 至 65 的数值范围,并将该数值范围细分为 4 个区间段 (20,35),(35,45),(45,55),(55,65) , 最后通过直方图的形式,展示该工厂员工在相应年龄区间的分布情况。
如果想要构建直方图,必须遵循以下步骤:
通常将 bin 指定为连续且不重叠的数值区间,而 bin 值指区间开始和结束的数值。
您可以使用下面的函数来绘制直方图:
matplotlib.pyplot.hist()
该函数的参数说明如下:
x
必填参数,数组或者数组序列。
bins
可选参数,整数或者序列,bins 表示每一个间隔的边缘(起点和终点)默认会生成10个间隔。
range
指定全局间隔的下限与上限值 (min,max),元组类型,默认值为 None。
density
如果为 True,返回概率密度直方图;默认为 False,返回相应区间元素的个数的直方图。
histtype
要绘制的直方图类型,默认值为“bar”,可选值有 barstacked(堆叠条形图)、step(未填充的阶梯图)、stepfilled(已填充的阶梯图)。
以下示例绘制了班级学生得分情况的直方图。其中定义了四个区间(bins)分别是:0-25、26-50、51-75 和 76-100。直方图显示了相应范围的学生人数。
上述代码执行后,输出结果如下:
图1:直方图绘制结果
19饼状图
饼状图用来显示一个数据系列,具体来说,饼状图显示一个数据系列中各项目的占项目总和的百分比。
Matplotlib 提供了一个 pie() 函数,该函数可以生成数组中数据的饼状图。您可使用 x/sum(x) 来计算各个扇形区域占饼图总和的百分比。pie() 函数的参数说明如下:
X
数组序列,数组元素对应扇形区域的数量大小。
labels
列表字符串序列,为每个扇形区域备注一个标签名字。
color
为每个扇形区域设置颜色,默认按照颜色周期自动设置。
autopct
格式化字符串"fmt%pct",使用百分比的格式设置每个扇形
区的标签,并将其放置在扇形区内。
以下示例:关于不同计算机语言学习人数的饼状图。autopct 参数设置为 %1.2f% ,并将各项所占总和的百分比显示在相对应的扇形区内。
输出结果如下:
图1:Matplotlib饼状图
20折线图
折线图(line chart)是我们日常工作、学习中经常使用的一种图表,它可以直观的反映数据的变化趋势。与绘制柱状图、饼状图等图形不同,Matplotlib 并没有直接提供绘制折线图的函数,因此本节着重讲解如何绘制一幅折线图。
下面示例是关于 C语言中文网用户活跃度的折线图:
显示结果如下:
当学习完如何绘制单条折线的绘制后,再绘制多条折线也变的容易,只要准备好绘制多条折线图的数据即可。
下面是一个简单示例,绘制了两天内同一时刻,天气温度随时间变化的折线图:
显示结果如下:
21散点图
散点图用于在水平轴和垂直轴上绘制数据点,它表示了因变量随自变量变化的趋势。通俗地讲,它反映的是一个变量受另一个变量的影响程度。
散点图将序列显示为一组点,其中每个散点值都由该点在图表中的坐标位置表示。对于不同类别的点,则由图表中不同形状或颜色的标记符表示。同时,您也可以设置标记符的颜色或大小。
下面示例,绘制了学生考试成绩的散点图,其中蓝色代表男孩成绩,红色表示女孩的成绩。
代码执行后,输出结果如下:
图1:绘制散点图
22等高线图
等高线图(也称“水平图”)是一种在二维平面上显示 3D 图像的方法。等高线有时也被称为 “Z 切片”,如果您想要查看因变量 Z 与自变量 X、Y 之间的函数图像变化(即 Z=f(X,Y)),那么采用等高线图最为直观。
自变量 X 和 Y 需要被限制在矩形网格内,您可以将 x 、y 数组作为参数传递给 numpy.meshgrid() 函数来构建一个网格点矩阵。
关于 meshgrid() 函数用法可参考《numpy.meshgrid()用法详解》。
Matplotlib API 提供了绘制等高线(contour)与填充等高线( contourf)的函数。这两个函数都需要三个参数,分别是 X、Y 与 Z。
代码执行后,输出结果如下:
图1:等高线示例图
左侧图像绘制了两个变量 X、Y ,右侧的颜色柱(colorbar)则表示 X 的取值,颜色越深表示值越小,中间深色部分的圆心点表示 x=0,y=0,z=0。
23振动图
振动图也叫磁场图,或量场图,其图像的表现形式是一组矢量箭头,其数学含义是在点 (x,y) 处具有分向量 (u,v)。
Matplotlib 提供绘制量场图的函数,如下所示:
quiver(x,y,u,v)
上述函数表示,在指定的 (x,y) 坐标上以箭头的形式绘制向量,参数说明如下:
参数
说明
x
一维、二维数组或者序列,表示箭头位置的x坐标。
y
一维、二维数组或者序列,表示箭头位置的y坐标。
u
一维、二维数组或者序列,表示箭头向量的x分量。
v
一维、二维数组或者序列,表示箭头向量的y分量。
c
一维、二维数组或者序列,表示箭头颜色。
以下示例,绘制了一个简单的振动图:
上述代码执行后,输出结果如下:
图1:振动示例图
24箱型图
箱型图(也称为盒须图)于 1977 年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
在箱型图中,我们从上四分位数到下四分位数绘制一个盒子,然后用一条垂直触须(形象地称为“盒须”)穿过盒子的中间。上垂线延伸至上边缘(最大值),下垂线延伸至下边缘(最小值)。箱型图结构如下所示:
图1:箱型如结构图
首先准备创建箱型图所需数据:您可以使用numpy.random.normal()函数来创建一组基于正态分布的随机数据,该函数有三个参数,分别是正态分布的平均值、标准差以及期望值的数量。如下所示:
然后用 data_to_plot 变量指定创建箱型图所需的数据序列,最后用 boxplot() 函数绘制箱型图,如下所示:
上述代码执行后,输出结果如下:
25小提琴图
小提琴图(Violin Plot)是用来展示数据分布状态以及概率密度的图表。这种图表结合了箱形图和密度图的特征。小提琴图跟箱形图类似,不同之处在于小提琴图还显示数据在不同数值下的概率密度。
小提琴图使用核密度估计(KDE)来计算样本的分布情况,图中要素包括了中位数、四分位间距以及置信区间。在数据量非常大且不方便一一展示的时候,小提琴图特别适用。
概率密度估计、置信区间、四分位间距都属于统计学中的概念,可自行查阅,这里不做说明。
小提琴图比箱型图能提供了更多的信息。虽然箱型图显示了均值、中位数和上、下四分位数等统计信息,但是小提琴图却显示了数据的完整分布情况,这更利于数据的分析与比对。下面是小提琴图的使用示例:
输出结果如下:
26绘制文本
Matplotlib 支持广泛的文本格式,比如 TTF 页面语言、Unicode 字符等。这是因为 Matplotlib 内置了 matplotlib.font_manager 字体管理器,它是一个实现了跨平台,并符合 W3C 字体查找算法的字体集合。
TTF(TrueType Font) 是苹果公司和微软公司合作开发的页面描述语言,用来描述字符的轮廓,结合了光栅技术和矢量技术的优点。
用户可以对文本属性进行控制,比如字体大小、粗细、位置和颜色等。
与此同时,Matplotlib 也支持绘制 TeX 包含的数学符号。TeX 是一套功能强大、十分灵活的排版语言,它可以用来绘制文本、符号、数学表达式等。通过下表中的方法可以绘制出相应的内容:
text
在绘图区域的任意位置添加文本。
annotate
在绘图区域的任意位置添加带有可选箭头的注释。
xlabel
在绘图区域的 x 轴上添加标签。
ylabel
在绘图区域的 y 轴上添加标签。
title
为绘图区域添加标题。
figtext
在画布的任意位置添加文本。
suptitle
为画布中添加标题。
Matplotlib 使用pyplot模块中的 text() 函数绘制文本,函数的语法格式如下:
plt.text(x, y, string, weight="bold", color="b")
参数说明如下:
下面使用 text() 函数会创建一个文本对象。示例如下:
代码执行结果如下:
图1:Matplotlib文本绘图
27数字表达式
Matplotlib 中的文本字符串都可以使用 Text Markup(一种文本标记语言)显现出来,具体的使用方法是将文本标记符放在一对美元符号$内,语法格式如下:
#数学表达式
plt.title(r'$\alpha > \beta$')
如果要绘制下标和上标,您需要使用'_'和'^'符号,下面是一个简单的示例:
上面代码的输出结果:
Matplotlib数学表达式绘制
29图像处理
Matplotlib 软件包中的image模块提供了加载、缩放和显示图像的功能,该模块只能支持 PNG 格式的图片,如果格式不符,需要对图片的格式进行转换。
Matplotlib 支持的图片格式非常有限,所以通常情况下,建议采用 Python 图像处理库 Pillow 来处理图像,若感兴趣可以自行了解。
下面示例,imread() 函数用于读取图像数据并形成 ndarray 数组 ,其数据类型为 float32。
假设在当前目录中存在名为 mtplogo.png 的图像。
图1:mtplogo图像
通过执行 imsave() 函数,可以将包含图像数据的 ndarray 数组保存到磁盘文件中。
plt.imsave("logo.png", img, cmap = 'gray', origin = 'lower')
如下所示,将 imsave()方法的origin参数设置为 lower 实现了原始图像的垂直翻转。
图2:垂直翻转图
通过 imshow() 函数可以在 Matplotlib 查看器上绘制出相应的图像。其函数格式如下:
imgplot = plt.imshow(img)
下面列举一组示例:
输出结果如下:
图3:输出结果
30转换对象
Matplotlib 是一款轻量级的图形转换框架,它通过转换对象轻松地实现了数据坐标系、轴域坐标系、图形坐标系,以及显示坐标系四者之间的相互转换,由于这种转换是 Matplotlib 自动完成的,因此无需考虑其底层原理。
下面对四种坐标系做简单说明,其中ax代表轴域对象的实例;fig代表图形对象的实例。
Matplotlib坐标系和转换对象
坐标系
转换对象
描述
Data
ax.transData
数据坐标系,由 xlim 和 ylim 控制。
Axes
ax.transAxes
轴域坐标系(即绘图区坐标系),(0,0) 在轴域坐标系左下角,(1,1)在轴域坐标系的右上角。
Figure
fig.transFigure
图形坐标系。(0,0) 在图的左下角,(1,1) 在图的右上角。
Display
None
显示坐标系。(0,0)显示左下角,而(width,height) 则显示右上角。注意,此处以像素 px 为单位。
转换对象作用就是在不同对象之间架起一座沟通的桥梁。输入一组数据最终以图像的形式显示,这个过程就是依靠转换对象来实现的。
上表中的 Data、Axes、Figure,这三个转换对象都可以接受一组数据,它们会将接受的数据转换到显示坐标系中,即 Display。在这个过程中,显示坐标系只是充当数据的接收者,因此显示坐标系不存在转换对象。
下面举一个简单的示例,现有文本“my text”放置在数据点 (x,y) 位置处:
axes.text(x,y,"my text")
通过 Axes 转换对象,我们可以指定文本的位置。使用以下代码,将文本移动至在坐标系的中心位置:
axes.text(0.5, 0.5, "middle of graph", transform=axes.transAxes)
手机扫一扫
移动阅读更方便
你可能感兴趣的文章