1. 时序练习(广告渠道vs销量预测)
阅读原文时间:2023年07月08日阅读:1

用散点图来看下sales销量与哪一维度更相关。

和目标销量的关系的话,那么这就是多元线性回归问题了。

上面把所有的200个数据集都用来训练了,现在把数据集拆分一下,分成训练集合测试集,再进行训练。

可参考带代码中的点:

"""参考网友代码:"""

coding: utf-8

import os, sys
from datetime import datetime
import matplotlib.pyplot as plt
import pandas as pd

512070,易方达沪深300非银ETF基金

df = pd.read_csv('512070.csv', index_col='date')
df1 = df[['jz']]
print(df1.head())

600030,中信证券,为了与基金净值比较,收盘价/10

df = pd.read_csv('600030.csv', index_col='date')#参考点0
df2 = df[['close']].apply(lambda x:x/10)#参考点1
print(df2.head())

pandas DataFrame 连接表

df3 = pd.merge(df1, df2, left_index=True, right_index=True, how='inner')#参考点2
#df3 = df1.join(df2, how='inner')
print(df3.head())

df3.index = pd.to_datetime(df3.index)

每一年数据的相关性分析

print("2017Y:\n", df3[ df3.index.year==2017 ].corr()['jz'])#参考点3
print("2018Y:\n", df3[ df3.index.year==2018 ].corr()['jz'])
print("2019Y:\n", df3[ df3.index.year==2019 ].corr()['jz'])
print("all:\n", df3.corr()['jz'])#参考点4

手机扫一扫

移动阅读更方便

阿里云服务器
腾讯云服务器
七牛云服务器

你可能感兴趣的文章