在回归任务(对连续值的预测)中,常见的评估指标(Metric)有:平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE),其中用得最为广泛的就是MAE和MSE。下面依次来进行一个大致的介绍,同时对于下面所有的计算公式:
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/ce59f55893efd960f1dbdfcd5c192a96.png)
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/79df73a7a9e4c5b9eacd54097b1d6605.png)
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/b1677f9423a31be742701330c190cf05.png)
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/ff3b399485568c1abcd79f34d4ebcf3f.png)
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/b1677f9423a31be742701330c190cf05.png)
一,评价回归模型的指标
1,均方误差
均方误差(MSE)的定义如下,

2,均方根误差
均方根误差(RMSE)是回归模型的典型指标,用于指示模型在预测中会产生多大的误差,对于较大的误差,权重较高。

y是实际值,而y~ 是预测值, RMSE越小越好。
3,平均绝对误差
平均绝对误差(MAE)用来衡量预测值与真实值之间的平均绝对误差,MAE越小表示模型越好,其定义如下:

4,R2分数
sklearn在实现线性回归时默认采用了[公式]指标,[公式]越大表示模型越好,其定义如下:

其中
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/5f0afdb206594f5e9f6fc5f6dcfd3bcf.png)
![[公式]](https://i-blog.csdnimg.cn/blog_migrate/356b85a3a9abe0f9b79b64d4202c41b1.png)

二,偏差和方差
偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据。
方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散。

参考文档:
所有评论(0)