关注公众号“轻松学编程”了解更多。
以下命令都是在浏览器中输入。
cmd命令窗口输入:jupyter notebook
后打开浏览器输入网址http://localhost:8888/
import numpy as np
查看numpy版本
np.__version__
Numpy可以提供数组支持以及相应的高效处理函数,是Python数据分析的基础,也是SciPy、Pandas等数据处理和科学计算库最基本的函数功能库,且其数据类型对Python数据分析十分有用。
参数为列表: 如[1, 4, 2, 5, 3]
arr1=np.array([1,2,3,4])
arr1 #点击shift + Enter后可直接查看数组
type(arr1)
输出:numpy.ndarray
arr2= np.array([[1,2,3],[4,5,6],[7,8,9]])
arr2
如创建三维数组:
arry3=np.array([[[1,2,3],[4,5,6],[7,8,9]]])
arry3
如:
np.array([1,2,'a'])
输出:array(['1', '2', 'a'],
dtype='<U11')
shape的使用:shape返回的是ndarray的数组形状(返回类型是元组)。返回值的数据个数表示的就是数组的维度
arr2.shape
输出:(3, 3) #意思是arr2是一个3行3列的数组
import matplotlib.pyplot as plt
img=plt.imread(r'./虎.jpg') #img此时就是numpy.ndarray
img.shape
输出:(369, 389, 3) #img形状为三维数组,369*389像素,3代表颜色维度
type(img)
输出:numpy.ndarray
plt.imshow(img)
plt.show()
######2.4修改图片
img_ecg=img-50 #img-50意思是每个元素减去50,数组值改变,图片自然会改变
plt.imshow(img_ecg)
plt.show()
包含以下常见创建方法:
#创建2行2列的全部数值都为1的二维数组
arr= np.ones(shape=(2,2),dtype=int)
arr
输出:array([[1, 1],
[1, 1]])
#创建2行3列的全部数值都为0的二维数组
arr=np.zeros([2,3])
arr
输出:array([[ 0., 0., 0.],
[ 0., 0., 0.]])
#创建2行3列的全部数值都为10的二维数组
#fill_value参数为数组填充的值
arr=np.full(shape=(2,4),fill_value=10,dtype=int)
arr
输出:array([[10, 10, 10, 10],
[10, 10, 10, 10]])
#数组初值为0,有10个值,终值为9
arr_linspace=np.linspace(start=0,stop=10,num=10,endpoint=False)
arr_linspace
输出:array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])
##数组初值为0,有5(10除以2)个值,终值为8,只能创建一维数组
arr_arange=np.arange(0,10,2)
arr_arange
输出:array([0, 2, 4, 6, 8])
#创建一个随机数在[10,90)的3行4列二维数组
#size=[3]则是一个一维数组,size=[3,4,5]则是三维数组
#随机原理:根据当前系统的时间产生随机数
#可以固定种子,使用seed(种子)函数
#np.random.seed(1)
np.random.randint(10,90,size=[3,4])
#创建一个10个元素的一维数组
np.random.randn(10)
#创建一个多维数组
#如创建10行,10列的数组
np.random.randn((10,10))
生成[0,1)的随机数
#创建一个2行2列的数值在[0,1)的二维数组
np.random.random(size=[2,2])
以给定的形状创建一个数组,并在数组中加入在[0,1)之间均匀分布的随机样本。
np.random.rand(10)
np.random.rand(2,2)
#创建一个对角线为1的矩阵(二维数组)
arr_eys=np.eye(4)
arr_eys
输出:
array([[ 1., 0., 0., 0.],
[ 0., 1., 0., 0.],
[ 0., 0., 1., 0.],
[ 0., 0., 0., 1.]])
4个必记参数:
ndim:维度
shape:形状(各维度的长度)
size:总长度
dtype:元素类型
arr_eys.ndim
输出:2
arr_eys.shape
输出:(4, 4) #4行4列的二维数组
arr_eys.size
输出:16
arr_eys.dtype
输出:dtype('float64')
type(arr_eys)
输出:numpy.ndarray
通过下标来获取元素。一维与列表完全一致 多维时同理 。
np.random.seed(10)
arr=np.random.randint(10,50,size=(3,4))
arr
输出:
array([[19, 46, 25, 10],
[38, 35, 39, 39],
[18, 19, 10, 46]])
#索引
arr[1][2]
输出:39
也根据索引修改数据 。
通过冒号来切片,通过逗号来区分维度。一维与列表完全一致 多维时同理 。
#获取前两行数据
arr[0:2]
输出:
array([[19, 46, 25, 10],
[38, 35, 39, 39]])
#获取前两行的前两列数据
arr[0:2,0:2]
输出:
array([[19, 46],
[38, 35]])
逗号左边切的是第一个维度(行),逗号右边切的是第二个维度(列)
#获取二维数组前两列数据
arr[:,0:2]
输出:
array([[19, 46],
[38, 35],
[18, 19]])
一维
将数据反转,例如[1,2,3]---->[3,2,1
#创建一维数组
arr=np.arange(0,10)
arr
输出:
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
#反转
arr[::-1]
输出:
array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])
二维
#创建一个3行3列的二维数组
arr=np.linspace(0,9,num=9,endpoint=False).reshape((3,3))
arr
输出:
array([[ 0., 1., 2.],
[ 3., 4., 5.],
[ 6., 7., 8.]])
#将数组的行倒序
arr[::-1]
输出:
array([[ 6., 7., 8.],
[ 3., 4., 5.],
[ 0., 1., 2.]])
#将数组的列倒序
arr[:,::-1]
输出:
array([[ 2., 1., 0.],
[ 5., 4., 3.],
[ 8., 7., 6.]])
#全倒置
arr[::-1,::-1]
输出:
array([[ 8., 7., 6.],
[ 5., 4., 3.],
[ 2., 1., 0.]])
读取图片
import matplotlib.pyplot as plt
img=plt.imread(r'./虎.jpg')
type(img)
输出:
numpy.ndarray
#显示图片
plt.imshow(img)
plt.show()
左右倒置图片
img_lr=img[::,::-1]
plt.imshow(img_lr)
plt.show()
上下倒置图片
img_ab=img[::-1]
plt.imshow(img_ab)
plt.show()
全倒置图片
img_all=img[::-1,::-1]
plt.imshow(img_all)
plt.show()
使用arr.reshape()函数,注意参数是一个tuple(元组)!
#创建一个随机数在[1,800)的10个元素的一维数组
arr=np.random.randint(1,800,size=(10,))
arr.shape
输出:(10,)
#将一维数组变形成2行5列的二维数组
arr2=arr.reshape((2,5))
arr2.shape
输出:
(2, 5)
使用-1自动计算行数(或列数)
#将一维数组变形成2行5列的二维数组
arr2=arr.reshape((-1,5))
arr2.shape
输出:
(2, 5)
#将一维数组变形成2行5列的二维数组
arr2=arr.reshape((2,-1))
arr2.shape
输出:
(2, 5)
#将arr2变形成一维数组
arr3=arr2.reshape(10)
arr3.shape
输出:(10,)
使用-1自动计算元素个数
arr=arr2.reshape(-1)
arr.shape
输出:(10,)
一维
a1=np.array([1,2,3])
np.concatenate([a1,a1])
输出:
array([1, 2, 3, 1, 2, 3])
#创建两个二维数组
a1=np.random.randint(0,100,size=(3,4))
a2=np.random.randint(0,100,size=(3,4))
二维
#创建两个二维数组
a1=np.random.randint(0,100,size=(3,4))
a2=np.random.randint(0,100,size=(3,4))
a1
输出:
array([[18, 53, 32, 84],
[93, 28, 41, 26],
[30, 20, 47, 6]])
a2
输出:
array([[14, 35, 15, 73],
[90, 16, 58, 51],
[69, 41, 4, 60]])
列跟列连在一起
#axis=0表示纵向(列跟列连接在一起)级联
np.concatenate([a1,a2],axis=0)
输出:
array([[18, 53, 32, 84],
[93, 28, 41, 26],
[30, 20, 47, 6],
[14, 35, 15, 73],
[90, 16, 58, 51],
[69, 41, 4, 60]])
行与行连接在一起
#axis=1表示横向(行跟行连接在一起)级联
np.concatenate([a1,a2],axis=1)
输出:
array([[18, 53, 32, 84, 14, 35, 15, 73],
[93, 28, 41, 26, 90, 16, 58, 51],
[30, 20, 47, 6, 69, 41, 4, 60]])
axis参数的取值范围:取值范围是由级联的数组维度决定的 (0-(维度-1))
级联需要注意的点:
水平级联与垂直级联,代替axis参数。
np.hstack((a1,a2))
输出:
array([[18, 53, 32, 84, 14, 35, 15, 73],
[93, 28, 41, 26, 90, 16, 58, 51],
[30, 20, 47, 6, 69, 41, 4, 60]])
np.vstack((a1,a2))
输出:
array([[18, 53, 32, 84],
[93, 28, 41, 26],
[30, 20, 47, 6],
[14, 35, 15, 73],
[90, 16, 58, 51],
[69, 41, 4, 60]])
img=plt.imread(r'./虎.jpg')
img.shape
输出:
(738, 389, 3)
plt.imshow(img)
plt.show()
#上下合并
img_v=np.concatenate((img,img),axis=0)
img_v.shape
输出:
(738, 389, 3)
plt.imshow(img_v)
plt.show()
#左右合并
img_h=np.concatenate((img,img),axis=1)
img_h.shape
输出:
(369, 778, 3)
plt.imshow(img_h)
plt.show()
与级联类似,三个函数完成切分工作:
np.split(arr,行/列号,轴):参数2是一个列表类型
np.vsplit(arr,行/列号) 水平切
np.hsplit(arr,行/列号) 垂直切
返回值是一个列表
arr=np.array([[3,2,4],[9,5,8],[2,7,1]])
arr
输出:
array([[3, 2, 4],
[9, 5, 8],
[2, 7, 1]])
np.split()
#切分第1、2列(下标从0开始),切两刀,返回一个列表
np.split(arr,[1,2],axis=1)
输出:
[array([[3],
[9],
[2]]), array([[2],
[5],
[7]]), array([[4],
[8],
[1]])]
np.vsplit()
#切分第1行(下标从0开始),切一刀,返回一个列表
np.vsplit(arr,[1])
输出:
[array([[3, 2, 4]]), array([[9, 5, 8],
[2, 7, 1]])]
np.hsplit()
#切分第1列(下标从0开始),切一刀,返回一个列表
np.hsplit(arr,[1])
输出:
[array([[3],
[9],
[2]]), array([[2, 4],
[5, 8],
[7, 1]])]
#axis=0,水平切
img=plt.imread(r'./虎.jpg')
img.shape
输出:
(369, 389, 3)
img_list=np.split(img,[170],axis=0)
plt.imshow(img_list[0])
plt.show()
所有赋值运算不会为ndarray的任何元素创建副本。对赋值后的对象的操作也对原来的对象生效。
a=np.array([1,2,3,4,5])
a1=a
a[1]=222
a
输出:
array([ 1, 222, 3, 4, 5])
a1
输出:
array([ 1, 222, 3, 4, 5])
可使用copy()函数创建副本
a=np.array([1,2,3,4,5])
a1=a.copy()
a[1]=222
a
输出:
array([ 1, 222, 3, 4, 5])
a1
输出:
array([1, 2, 3, 4, 5])
方式1:np.ravel(a,order=‘C’)
方式2:ndarray.racel(order=‘C’)
把多维数组扁平化成一维数组。参数’C’表示按行进行扁平,'F’表示按列进行扁平。
#创建二维数组
arr1=np.array([[1,2],[3,4]])
arr1
arr1.ravel(order='C')
arr1.ravel(order='F')
np.ravel(arr1)
np.ravel(arr1,order='F')
把多个数组合并成一个数组。
arr1=np.array([1,2,3,4])
arr1
结果为:
array([1, 2, 3, 4])
np.c_[arr1,arr1]
结果为:
array([[1, 1],
[2, 2],
[3, 3],
[4, 4]])
多维数组:
#创建三维数组
arr2=np.array([[[1,2,3],[4,5,6],[7,8,9]]])
arr2
结果为:
array([[[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]])
np.c_[arr2,arr2,arr2]
结果为:
array([[[1, 2, 3, 1, 2, 3, 1, 2, 3],
[4, 5, 6, 4, 5, 6, 4, 5, 6],
[7, 8, 9, 7, 8, 9, 7, 8, 9]]])
np.unique(ar,return_counts=False)
参数ar:数组
参数return_counts:返回每个元素出现的次数
返回值是一个 元组。
arr=np.array([11,1,2,3,4,11,3,5])
np.unique(arr,return_counts=True)
#导入包
from IPython.display import display
a=np.array([1,2,3,4])
b=np.array([5,6,7])
display(a,b)
一维
arr=np.linspace(0,10,10,endpoint=False)
arr
输出:
array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])
np.sum(arr,axis=0)
输出:
45.0
二维
np.random.seed(8)
arr2=np.random.randint(0,10,size=(3,4))
arr2
输出:
array([[3, 4, 1, 9],
[5, 8, 3, 8],
[0, 5, 1, 3]])
axis=0,列相加
np.sum(arr2,axis=0)
输出:
array([ 8, 17, 5, 20])
axis=1,行相加
np.sum(arr2,axis=1)
输出:
array([17, 24, 9])
np.random.seed(8)
arr2=np.random.randint(0,10,size=(3,4))
arr2
输出:
array([[3, 4, 1, 9],
[5, 8, 3, 8],
[0, 5, 1, 3]])
axis=0,列最小值
np.min(arr2,axis=0)
输出:
array([0, 4, 1, 3])
axis=1,行最小值
np.min(arr2,axis=1)
输出:
array([1, 3, 0])
arr2=np.array([[1,2,3],[3,4,5]])
arr2
输出:
array([[1, 2, 3],
[3, 4, 5]])
axis=0,列平均值
np.mean(arr2,axis=0)
输出:
array([ 2., 3., 4.])
axis=1,行平均值
np.mean(arr2,axis=1)
输出:
array([ 2., 4.])
Function Name NaN-safe Version Description
np.sum np.nansum Compute sum of elements
np.prod np.nanprod Compute product of elements
np.mean np.nanmean Compute mean of elements
np.std np.nanstd Compute standard deviation
np.var np.nanvar Compute variance
np.min np.nanmin Find minimum value
np.max np.nanmax Find maximum value
np.argmin np.nanargmin Find index of minimum value
np.argmax np.nanargmax Find index of maximum value
np.median np.nanmedian Compute median of elements
np.percentile np.nanpercentile Compute rank-based statistics of elements
np.any N/A Evaluate whether any elements are true
np.all N/A Evaluate whether all elements are true
np.power 幂运算
加减乘除
#创建一个3行3列的二维数组x1
x1 = np.arange(9.0).reshape((3, 3))
x1
输出:
array([[ 0., 1., 2.],
[ 3., 4., 5.],
[ 6., 7., 8.]])
#创建一个3个元素的一维数组x2
x2 = np.arange(3.0)
x2
输出:
array([ 0., 1., 2.])
x1+x2
x1+x2
输出:
array([[ 0., 2., 4.],
[ 3., 5., 7.],
[ 6., 8., 10.]])
x2会自动补全成
array([[ 0., 1., 2.],
[ 0., 1., 2.],
[ 0., 1., 2.]])
再和x1相加,对应的元素相加。【广播机制】
两个集合中,a的行数和b的列数必须保持一致
arr1=np.array([[1,2],[3,4]])
arr1
输出:
array([[1, 2],
[2, 3]])
arr2=np.array([[5,6],[7,8]])
arr2
输出:
array([[5, 6],
[7, 8]])
np.dot(arr1,arr2)
输出:
array([[19, 22],
[31, 36]])
函数np.linalg.inv()
矩阵相乘:行和列相同,行乘列。
#导包
import numpy as np
from IPython.display import display
# 创建两个二维数组
a = np.random.randint(0,10,size = (2,3))
b = np.random.randint(0,10,size = (3,4))
display(a,b)
#矩阵点乘:行乘列:8*0+4*8+4*4 = 48
np.dot(a,b)
#单元矩阵:a_T*a
unit_a = np.dot(a_T,a)
# 逆矩阵的求解:
nverse_matrix = np.linalg.inv(unit_a)
nverse_matrix
【重要】ndarray广播机制的三条规则:缺失维度的数组将维度补充为进行运算的数组的维度。缺失的数组元素使用已有元素进行补充。
例1: m = np.ones((2, 3)) a = np.arange(3) 求m+a
m=np.ones((2,3))
a=np.arange(3)
m
输出:
array([[ 1., 1., 1.],
[ 1., 1., 1.]])
a
输出:
array([0, 1, 2])
m+a
输出:
array([[ 1., 2., 3.],
[ 1., 2., 3.]])
np.random.seed(3)
arr=np.random.randint(0,10,size=(3,4))
arr
输出:
array([[8, 9, 3, 8],
[8, 0, 5, 3],
[9, 9, 5, 7]])
#默认排序,对行进行从小到大的排序,参数axis默认为-1
np.sort(arr)
输出:
array([[3, 8, 8, 9],
[0, 3, 5, 8],
[5, 7, 9, 9]])
#np.sort(arr)不改变arr,arr和原来一样
arr
输出:
array([[8, 9, 3, 8],
[8, 0, 5, 3],
[9, 9, 5, 7]])
#axis=0,按列进行排序
np.sort(arr,axis=0)
输出:
array([[8, 0, 3, 3],
[8, 9, 5, 7],
[9, 9, 5, 8]])
#按行进行排序
np.sort(arr,axis=1)
输出:
array([[3, 8, 8, 9],
[0, 3, 5, 8],
[5, 7, 9, 9]])
arr.sort()会改变arr
#有一个参数axis,默认为-1,按行排序
arr.sort()
arr
输出:
array([[3, 8, 8, 9],
[0, 3, 5, 8],
[5, 7, 9, 9]])
np.partition(a,k)
有的时候我们不是对全部数据感兴趣,我们可能只对最小或最大的一部分感兴趣。
当k为正时,我们想要得到最小的k个数
当k为负时,我们想要得到最大的k个数
np.random.seed(3)
arr=np.random.randint(0,10,size=(3,4))
arr
输出:
array([[8, 9, 3, 8],
[8, 0, 5, 3],
[9, 9, 5, 7]])
np.partition(arr,-3)
输出:
array([[3, 8, 9, 8],
[0, 3, 5, 8],
[5, 7, 9, 9]])
【后记】为了让大家能够轻松学编程,我创建了一个公众号【轻松学编程】,里面有让你快速学会编程的文章,当然也有一些干货提高你的编程水平,也有一些编程项目适合做一些课程设计等课题。
也可加我微信【1257309054】,拉你进群,大家一起交流学习。
如果文章对您有帮助,请我喝杯咖啡吧!
公众号
关注我,我们一起成长~~
手机扫一扫
移动阅读更方便
你可能感兴趣的文章