maxframe.learn.metrics.f1_score#

maxframe.learn.metrics.f1_score(y_true, y_pred, *, labels=None, pos_label=1, average='binary', sample_weight=None, zero_division='warn', execute=False, session=None, run_kwargs=None)[源代码]#

计算 F1 分数,也称为平衡 F 分数或 F 度量

F1 分数可以解释为精确率和召回率的加权平均值,其中 F1 分数的最佳值为 1,最差值为 0。精确率和召回率对 F1 分数的相对贡献相等。F1 分数的公式为:

F1 = 2 * (precision * recall) / (precision + recall)

在多类和多标签情况下,这是每个类别的 F1 分数的平均值,其权重取决于 average 参数。

更多信息请参阅 用户指南

参数:
  • y_true (1d array-like, or label indicator array / sparse matrix) -- 真实(正确)的目标值。

  • y_pred (1d array-like, or label indicator array / sparse matrix) -- 由分类器返回的预测目标值。

  • labels (list, optional) -- 当 average != 'binary' 时要包含的标签集合,以及当 average is None 时它们的顺序。数据中存在的标签可以被排除,例如在计算多类平均值时忽略多数负类,而数据中不存在的标签将在宏平均中导致 0 组件。对于多标签目标,标签是列索引。默认情况下,将使用 y_truey_pred 中的所有标签并按排序顺序排列。

  • pos_label (str or int, 1 by default) -- 如果 average='binary' 且数据是二分类的,则报告该类别。如果数据是多类或多标签的,则此参数将被忽略;设置 labels=[pos_label]average != 'binary' 将仅报告该标签的分数。

  • average (string, [None, 'binary' (default), 'micro', 'macro', 'samples', 'weighted']) -- 此参数对于多类/多标签目标是必需的。如果为 None,则返回每个类别的分数。否则,此参数决定对数据执行的平均类型:'binary': 仅报告由 pos_label 指定的类别的结果。 此选项仅适用于目标(y_{true,pred})是二分类的情况。 'micro': 通过计算总的真正例、假负例和假正例全局计算指标。 'macro': 计算每个标签的指标,并求其未加权平均值。这不考虑标签不平衡。 'weighted': 计算每个标签的指标,并按支持度(每个标签的真正例数)加权平均。这会调整 “macro” 以考虑标签不平衡;它可能导致 F 分数不在精确率和召回率之间。 'samples': 计算每个实例的指标,并求其平均值(仅在多标签分类中与 accuracy_score() 不同时有意义)。

  • sample_weight (array-like of shape (n_samples,), default=None) -- 样本权重。

  • zero_division ("warn", 0 or 1, default="warn") -- 设置在零除法时返回的值,即所有预测和标签均为负时的情况。如果设置为 "warn",则其作用为 0,但也会引发警告。

返回:

f1_score -- 在二分类任务中为正类的 F1 分数,或多类任务中每个类别的 F1 分数的加权平均值。

返回类型:

float or array of float, shape = [n_unique_labels]

引用

示例

>>> from maxframe.learn.metrics import f1_score
>>> y_true = [0, 1, 2, 0, 1, 2]
>>> y_pred = [0, 2, 1, 0, 0, 1]
>>> f1_score(y_true, y_pred, average='macro')
0.26...
>>> f1_score(y_true, y_pred, average='micro')
0.33...
>>> f1_score(y_true, y_pred, average='weighted')
0.26...
>>> f1_score(y_true, y_pred, average=None)
array([0.8, 0. , 0. ])
>>> y_true = [0, 0, 0, 0, 0, 0]
>>> y_pred = [0, 0, 0, 0, 0, 0]
>>> f1_score(y_true, y_pred, zero_division=1)
1.0...

备注

true positive + false positive == 0 时,precision 未定义;当 true positive + false negative == 0 时,recall 未定义。在这种情况下,默认情况下指标将被设为 0,f-score 也是如此,并且将引发 UndefinedMetricWarning。此行为可以通过 zero_division 进行修改。