线性回归算法-3.线性回归算法的衡量标准

线性回归算法的衡量标准

均方误差（Mean Squared Error）

\[\frac{1}{m}\sum_{i=1}^{m}(y_{test}^{(i)}- \hat y{_{test}^{(i)}})^2\]

均方根误差（Root Mean Squared Error）
\[\sqrt{\frac{1}{m}\sum_{i=1}^{m}(y_{test}^{(i)}- \hat y{_{test}^{(i)}})^2}\]
平均绝对误差（Mean Absolute Error）
\[\frac{1}{m}\sum_{i=1}^{m} \left | (y_{test}^{(i)}- \hat y{_{test}^{(i)}}) \right| \]

加载波士顿房产数据

import numpy
import matplotlib.pyplot as plt
from sklearn import datasets
boston = datasets.load_boston()
# 打印此数据集的描述
print(boston.DESCR)

x = boston.data[:,5] #只取房间数量这个特征

plt.scatter(x,y)
plt.show()

存在边缘极值点，用numpy中的”fancy index”去除数据中的上限值

x = x[y<50]
y = y[y<50]
plt.scatter(x,y)
plt.show()

from mylib.model_selection import train_test_split
from mylib.SimpleLineRegression import SimpleLineRegression
x_train,x_test,y_train,y_test = train_test_split(x,y,seed =666)
reg = SimpleLineRegression()
reg.fit(x_train,y_train)
y_predict = reg.predict(x_test)

通过训练，得到了a,b两个参数，从而确定了线性方程

plt.scatter(x,y)
plt.plot(x,reg.predict(x))
plt.show()

MSE 均方误差

mse_test = numpy.sum((y_predict-y_test)**2) / len(x_test)

RMSE 均方根误差

import math
mse_test = numpy.sum((y_predict-y_test)**2) / len(x_test)
rmse_test = math.sqrt(mse_test)

MAE 平均绝对误差

mae_test = numpy.sum(numpy.absolute(y_predict-y_test)) / len(x_test) #absolute 求绝对值

上述算法指标封装为库：

metrics文件：

调用封装的算法度量库：

from mylib.metrics import mean_squared_error,root_mean_squared_error,mean_absolute_error
mean_squared_error(y_predict,y_test)
root_mean_squared_error(y_predict,y_test)
mean_absolute_error(y_predict,y_test)

sk-learn 中的MSE和MAE调用：

from sklearn.metrics import mean_squared_error,mean_absolute_error
mean_squared_error(y_predict,y_test)
mean_absolute_error(y_predict,y_test)

R Squared

表达式为: $ R^2 = 1 - \frac{\Sigma(\hat{y}^{(i)} - y^{(i)})^2}{\Sigma(\overline{y}^{(i)} - y^{(i)})^2 } = 1 - \frac{MSE(\hat{y},y)}{Var(y)} $

$ \Sigma(\hat{y}^{(i)} - y^{(i)})^2 = SS_{residual} $ 使用得到的模型预测产生的错误
$ \Sigma(\overline{y}^{(i)} - y^{(i)})^2 = SS_{total} $ 使用$y=\hat{y}$预测产生的错误（baseline Model）

var求方差
R2 = 1 - mean_squared_error(y_test,y_predict)/numpy.var(y_test)

封装到mylib中的metrics库中

from mylib.metrics import r2_score
r2_score(y_test,y_predict)
# 在线性回归类中封装score方法
reg.score(x_test,y_test)

转载于//www.cnblogs.com/shuai-long/p/11185059.html

线性回归算法-3.线性回归算法的衡量标准

线性回归算法的衡量标准

上述算法指标封装为库：

sk-learn 中的MSE和MAE调用：

R Squared

var求方差

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关线性回归算法-4.多元线性回归算法

相关线性回归算法-3.线性回归算法的衡量标准

相关线性回归算法-2.简单线性回归的实现

相关线性回归算法-1.简单线性回归原理

相关机器学习实战——标准线性回归和加权线性回归算法

相关人工智能-算法模型-线性回归

相关算法基础 | 【02】线性回归

相关【机器学习】线性回归，多元线性回归、自回归及衡量指标

相关线性回归实现及线性回归中衡量算法模型的标准(R-Squared,MSE.RMSE,MAE)

相关线性回归算法

随便看看

记录一次 Linux crontab 执行django 脚本失败的经历和解决办法

IDEA 笔记 -- /**注释多行变单行

IDEA 笔记 --注解模板自定义

理财产品的收益率也抵不上通货膨胀

朱哥黑科技--你必须看，无用的话我吃xiang

HTML-form表单的使用，常见表单元素（控件）的使用方法汇总

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表