学习自:python插值填补缺省值_插值缺失值2d python_weixin_39592315的博客-CSDN博客
假设我们有一个2D数组(或者矩阵),其中有一些缺省值NaN,就像下边这样:
1 2 3 NaN 5
2 3 4 NaN 6
3 4 NaN NaN 7
4 5 NaN NaN 5
5 6 7 8 9
我们怎么将这些NaN填充为一些合理的值呢?
我们可以用scipy.interpolate.griddata进行插值,这里先把完整代码放上来:
#二维缺省值插值
import numpy as np
from scipy import interpolate
array = np.random.random_integers(0,10,(10,10)).astype(float) #①
array[array>7] = np.nan
array = np.ma.masked_invalid(array)#②
x = np.arange(0, array.shape[1])#③
y = np.arange(0, array.shape[0])
xx,yy=np.meshgrid(x,y) #④
x1 = xx[~array.mask]#⑤
y1 = yy[~array.mask]
newarr = array[~array.mask].data
GD1 = interpolate.griddata((x1, y1), newarr.ravel(),(xx, yy),method='cubic')#⑥
array = np.random.randint(0,10,(10,10)).astype(float)
array[array>7]=np.nan
#生成形状为(10,10),值为[0,10)的随机int值的array
#将array中大于7的值设置为空
#结果array([[ 3., 0., 6., nan, nan, nan, 6., 3., 7., 6.],
[ 1., 4., 4., 6., nan, 4., 1., nan, 3., 5.],
[nan, 3., 0., nan, 4., 7., 7., 3., 3., 5.],
[ 0., 7., 0., 2., 6., 6., 1., 4., 7., nan],
[ 0., nan, nan, nan, 4., nan, 6., 0., 2., nan],
[ 2., 5., 2., nan, 6., nan, 1., 2., 4., 4.],
[ 4., 4., 0., 6., 5., 5., 3., 7., 7., 2.],
[ 1., 6., 0., 7., 5., 4., 3., 1., 7., 0.],
[ 2., 4., 4., nan, nan, 6., 3., 1., 5., 2.],
[ 3., 4., 0., 3., 3., 2., 4., 4., 2., nan]])
关于Masked Array这一点可以看Python:numpy.ma模块 - ShineLe - 博客园
array=np.ma.masked_invalid(array)
x=np.arange(0,array.shape[1])
y=np.arange(0,array.shape[1])
XX,YY=np.meshgrid(x,y)
x1=XX[~array.mask]
y1=YY[~array.mask]
newarr=array[~array.mask].data #提取Masked array中的data
这里的x1、y1、newarr都是一维的,每个元素都是一一对应的,即x1[i]、y1[i]、newarr[i]对应了第i+1个有效值的横纵坐标及值。
GD1 = interpolate.griddata((x1, y1), newarr.ravel(),(xx, yy),method='cubic')
关于inerpolate.griddata,可以看Python:Scipy.interpolate.griddata - ShineLe - 博客园
手机扫一扫
移动阅读更方便
你可能感兴趣的文章