您现在的位置是:首页 > 恋爱课程恋爱课程

兴趣指标分数 F1是合适的指标吗?那么F2 F3…F_beta呢?

2021-06-05 00:06:10恋爱课程人已围观

简介兴趣指标分数 F1是合适的指标吗?那么F2 F3…F_beta呢?然而,更通用的评分标准可能更好地评估模型性能。但是确定的模型指标不只有一个,还有很多其他指标。另一个关键度量是当今机器学习中常见的F指标,用于评估模型性能。F1分数的主要优点(同时也是缺点)是召回和精度同样重要。使用加权平均值,我们可以很容易地得到F2分数:我希望所提供的数据能够帮助那些处理分类任务的人,并帮助他们在使用准确性的同时使用F分数。以下是·的文档,有兴趣的可以详细进行阅读:////.

绅恋情感
限时免费领取5000条聊天话术,立即加导师微信领取:  bingo4977
(←长按复制)

兴趣指标分数 F1是合适的指标吗?那么F2 F3…F_beta呢?

使用 F1 分数进行二元分类测量是很常见的。这就是所谓的调和平均数。但是,更通用的评分标准可能会更好地评估模型性能。 F2和F3呢?在本文中,我们将回顾 F 指标。

简介

根据许多数据科学家的说法,模型性能最可靠的衡量标准是准确性。但模型指标不止一个,还有很多其他的指标。例如兴趣指标分数,准确率可能很高,但假阴性也很高。另一个关键指标是当今机器学习中常用的 F 指数,用于评估模型性能。它按比例结合了精度和召回率。在本文中,我们探索了表明两者之间不平衡的不同方法。

混淆矩阵、准确率和召回率

混淆矩阵总结了 ML 中监督学习算法的性能。它提供了比一般精度测量更详细的分析兴趣指标分数,因此更有益。在混淆矩阵中,每一行代表预测类中的一个实例兴趣指标分数,每一列代表实际类中的一个实例。简化的混淆矩阵包含两行两列,如前所述,其中:

我们定义了两个重要指标:准确度:TP 样本数除以所有 P 样本(真和假),召回率:TP 样本数除以 (TP+FN)。

因为这两个措施非常重要,所以需要一个措施来将两者结合起来。因此,提出了精确率和召回率的调和平均值,也称为F1分数。

F1 分数

计算方法如下:

F1 分数的主要优点(也是缺点)是召回率与准确率一样重要。在许多应用中,情况并非如此,应该使用一些权重来打破这种平衡假设。这种平衡假设可能适用于数据分布不均的情况,例如大量正负数据。

F2 和 F3 分数

使用加权平均,我们可以很容易地得到 F2 分数:

同理,F3 得分为:

得分

推广加权平均法得到的F beta测量结果为:

这种方法允许我们定义召回率比精确率更重要的程度。使用 F beta 指标非常简单,请查看以下示例:

>>> from sklearn.metrics import fbeta_score 
>>> y_true = [0, 1, 2, 0, 1, 2] 
>>> y_pred = [0, 2, 1, 0, 0, 1] 
>>> fbeta_score(y_true, y_pred, average='macro', beta=0.5) 
0.23... 
>>> fbeta_score(y_true, y_pred, average='micro', beta=0.5) 
0.33... 
>>> fbeta_score(y_true, y_pred, average='weighted', beta=0.5) 
0.23... 
>>> fbeta_score(y_true, y_pred, average=None, beta=0.5) 
array([0.71..., 0.        , 0.        ])

总结

在本文中,我回顾了 F 指标。希望提供的数据可以帮助到那些处理分类任务的人,帮助他们在使用准确率的同时使用F分数。

以下是·的文档,有兴趣的可以详细阅读:////...html?=f%#..

Tags:兴趣指标分数

很赞哦! ()

文章评论

留言与评论(共有 0 条评论)
   
验证码:

本栏推荐

站点信息

  • 文章统计12929篇文章
  • 浏览统计16868427次浏览
  • 评论统计0个评论
  • 标签管理标签云
  • 统计数据:统计代码
  • 微信:扫描二维码,关注我们