用散点图来看下sales销量与哪一维度更相关。
和目标销量的关系的话,那么这就是多元线性回归问题了。
上面把所有的200个数据集都用来训练了,现在把数据集拆分一下,分成训练集合测试集,再进行训练。
可参考带代码中的点:
"""参考网友代码:"""
import os, sys
from datetime import datetime
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv('512070.csv', index_col='date')
df1 = df[['jz']]
print(df1.head())
df = pd.read_csv('600030.csv', index_col='date')#参考点0
df2 = df[['close']].apply(lambda x:x/10)#参考点1
print(df2.head())
df3 = pd.merge(df1, df2, left_index=True, right_index=True, how='inner')#参考点2
#df3 = df1.join(df2, how='inner')
print(df3.head())
df3.index = pd.to_datetime(df3.index)
print("2017Y:\n", df3[ df3.index.year==2017 ].corr()['jz'])#参考点3
print("2018Y:\n", df3[ df3.index.year==2018 ].corr()['jz'])
print("2019Y:\n", df3[ df3.index.year==2019 ].corr()['jz'])
print("all:\n", df3.corr()['jz'])#参考点4
手机扫一扫
移动阅读更方便
你可能感兴趣的文章