机器学习----评估标准

蔚落 2023-06-18 09:55 22阅读 0赞

在机器学习中，要想检验训练的模型的准确性，比较好的做法是将整个数据集分为3个部分：训练集、验证集和测试集（而不是传统的训练集+测试集）。

训练集：通常占比60%，通过几种不同的算法分别得到训练出来的θ值。比如我选择不同的特征数量，采用x，x+x平方，x+x平方+x3次方等等训练出来的多种模型。
验证集：通常占比20%，将验证集中的数据分别待入用上述不同模型训练，最后得到损失函数，采用损失函数值中最小的值作为最后选择的模型会比较好。
测试集：通常占比20%，训练集用来训练出模型，验证集用来选择最好的模型，测试集就是用来测试这个模型的泛化性能了。将该测试集的数据代入验证集中选择出来的模型，可以看到最后的结果。

此外，用来判定模型好坏的标准还有错误率、准确率和召回率。

错误率：错误预测的样本数/总样本数。
准确率：true positive真正数/ (true positive+false positive) 真正数+假正数。具体来说，就是真正为1的那部分占你预测为1的全部数据的比例。
召回率：true positive真正数/ (true positive + false negative)真正数+假负数。具体是说，实际上为1的数据中你真正预测为1的比例。

准确率和召回率能够较好的适用于具有倾斜性的数据集中。

数据集的倾斜性是指正负样本的差别巨大，以至于简单地将所有样本预测为正或负反而比做模型预测出来的错误率更低。

但是实际来说，显然这样是不对的。所以错误率不能较好应用于这类数据。

实际上，准确率和召回率是一个负相关的关系，这就意味着如果想要一个较高的准确率，那就需要较低的召回率为代价。

这可以理解为，如果在logistic回归中，将h(x)>0.7预测为y=1，而不是0.5，那么这将会提高准确率，因为70%的可能才被预测为1，更加准确；而这比50%概率就预测为1的情况下y为1的数据更少了，所以减小了召回率的分子，这就降低了召回率。

发表评论取消回复

表情：

评论列表（有 0 条评论，22人围观）

还没有评论，来说两句吧...

相关阅读

相关机器学习——模型评估方法

：confusion\_matrix from sklearn.metrics import confusion_matrix confusion = ...

落日映苍穹つ/ 2024年04月18日 06:54/ 0 赞/ 237 阅读

相关机器学习模型评估

目录 1 误差平方和 2 “肘”方法 3 轮廓系数法 4 CH系数 5 小结 -------------------- 1 误差平方和

蔚落/ 2024年04月03日 09:56/ 0 赞/ 248 阅读

相关机器学习1：机器学习的模型评估方法

机器学习有两个非常重要的问题： 1.How well is my model doing? 如果我们已经训练好了模型，该模型效果如何，用什么方式来检为测？ 2.How d

Myth丶恋晨/ 2023年07月10日 05:30/ 0 赞/ 156 阅读

相关机器学习----评估标准

在机器学习中，要想检验训练的模型的准确性，比较好的做法是将整个数据集分为3个部分：训练集、验证集和测试集（而不是传统的训练集+测试集）。训练集：通常占比60%，通

蔚落/ 2023年06月18日 09:55/ 0 赞/ 23 阅读

相关机器学习评估标准汇总以及在python中的函数调用

机器学习评估标准汇总（未完）聚类性能度量外部指标 Jaccard系数 FM指数内部指标

淡淡的烟草味﹌/ 2023年05月22日 08:58/ 0 赞/ 16 阅读

相关机器学习分类模型评估指标

1、背景传统的机器学习分类一般按照有监督和无监督来进行区分，有监督主要是各种分类和回归的算法，无监督主要是聚类。新的机器学习方法主要包括：深度学习和强化学习。深度学习中

迈不过友情╰/ 2022年10月29日 04:28/ 0 赞/ 666 阅读

相关 AI－机器学习之模型评估

分享一个大牛的人工智能教程。零基础！通俗易懂！风趣幽默！希望你也加入到人工智能的队伍中来！请点击[http://www.captainbed.net][http_www.cap

￡神魔★判官ぃ/ 2022年10月16日 04:48/ 0 赞/ 449 阅读

相关机器学习（二）评估与度量

机器学习第二章评估与度量第二章路线图错误率: 分类错误的样

素颜马尾好姑娘i/ 2022年07月16日 13:46/ 0 赞/ 350 阅读

相关机器学习（评估方法）

2.留出法：将数据集D划分为两个互斥的集合，其中一个集合作为训练集S，另一个作为测试集T，随机划分，重复实验产生多个训练/测试集，取实验平均值。（注：通常，会将D中大约2/3−

超、凢脫俗/ 2022年05月12日 03:18/ 0 赞/ 428 阅读

相关机器学习 (五): 模型评估

机器学习模型评估交叉验证 Baseline 模型数值型baseline 分类型baseline ROC 曲线 Co

约定不等于承诺〃/ 2022年02月22日 19:22/ 0 赞/ 502 阅读