如何利用python进行线性回归分析?
1、导入需要用到的库,如果没有则先进行安装。
import numpy as np
import pandas as pd
from sklearn import linear_model #导入机器学习库中的线性回归方法
from matplotlib import pyplot as plt

2、读取或输入数据。
data=pd.DataFrame({'price':[12,52,33,24,51,26,37],'sales':[2030,509,1457,875,2301,1521,1689]})
print(data)

3、数据预处理。选择x,y变量,如果有空值,可以剔除。
x=np.array(data['price']).reshape([7,1])
y=np.array(data['sales']).reshape([7,1])

4、探索性数据分析。绘制散点图,观察数据关系及趋势变化。
plt.scatter(x,y)
plt.show()
从图形中可以看出,除去一些异常值的情况下,x,y之间存在一定的线性关系。
在实际情况中,用于线性回归的样本量应该稍大一些,趋势才会更明显。


5、建立线性回归模型,并进行模型训练。
model=linear_model.LinearRegression()
model.fit(x,y)
6、检验模型效果。
coef=model.coef_ #获取自变量系数
model_intercept=model.intercept_#获取截距
R2=model.score(x,y) #R的平方
print('线性回归方程为:','\n','y=’{}*x+{}'.format(coef,model_intercept))

7、利用上面的结果进行回归预测。
new_x=60
y_pre=model.predict(new_x)
print(y_pre)
