maxframe.learn.metrics.f1_score#
- maxframe.learn.metrics.f1_score(y_true, y_pred, *, labels=None, pos_label=1, average='binary', sample_weight=None, zero_division='warn', execute=False, session=None, run_kwargs=None)[源代码]#
计算 F1 分数,也称为平衡 F 分数或 F 度量
F1 分数可以解释为精确率和召回率的加权平均值,其中 F1 分数的最佳值为 1,最差值为 0。精确率和召回率对 F1 分数的相对贡献相等。F1 分数的公式为:
F1 = 2 * (precision * recall) / (precision + recall)
在多类和多标签情况下,这是每个类别的 F1 分数的平均值,其权重取决于
average参数。更多信息请参阅 用户指南。
- 参数:
y_true (1d array-like, or label indicator array / sparse matrix) -- 真实(正确)的目标值。
y_pred (1d array-like, or label indicator array / sparse matrix) -- 由分类器返回的预测目标值。
labels (list, optional) -- 当
average != 'binary'时要包含的标签集合,以及当average is None时它们的顺序。数据中存在的标签可以被排除,例如在计算多类平均值时忽略多数负类,而数据中不存在的标签将在宏平均中导致 0 组件。对于多标签目标,标签是列索引。默认情况下,将使用y_true和y_pred中的所有标签并按排序顺序排列。pos_label (str or int, 1 by default) -- 如果
average='binary'且数据是二分类的,则报告该类别。如果数据是多类或多标签的,则此参数将被忽略;设置labels=[pos_label]且average != 'binary'将仅报告该标签的分数。average (string, [None, 'binary' (default), 'micro', 'macro', 'samples', 'weighted']) -- 此参数对于多类/多标签目标是必需的。如果为
None,则返回每个类别的分数。否则,此参数决定对数据执行的平均类型:'binary': 仅报告由pos_label指定的类别的结果。 此选项仅适用于目标(y_{true,pred})是二分类的情况。'micro': 通过计算总的真正例、假负例和假正例全局计算指标。'macro': 计算每个标签的指标,并求其未加权平均值。这不考虑标签不平衡。'weighted': 计算每个标签的指标,并按支持度(每个标签的真正例数)加权平均。这会调整 “macro” 以考虑标签不平衡;它可能导致 F 分数不在精确率和召回率之间。'samples': 计算每个实例的指标,并求其平均值(仅在多标签分类中与accuracy_score()不同时有意义)。sample_weight (array-like of shape (n_samples,), default=None) -- 样本权重。
zero_division ("warn", 0 or 1, default="warn") -- 设置在零除法时返回的值,即所有预测和标签均为负时的情况。如果设置为 "warn",则其作用为 0,但也会引发警告。
- 返回:
f1_score -- 在二分类任务中为正类的 F1 分数,或多类任务中每个类别的 F1 分数的加权平均值。
- 返回类型:
参见
fbeta_score,precision_recall_fscore_support,jaccard_score,multilabel_confusion_matrix引用
示例
>>> from maxframe.learn.metrics import f1_score >>> y_true = [0, 1, 2, 0, 1, 2] >>> y_pred = [0, 2, 1, 0, 0, 1] >>> f1_score(y_true, y_pred, average='macro') 0.26... >>> f1_score(y_true, y_pred, average='micro') 0.33... >>> f1_score(y_true, y_pred, average='weighted') 0.26... >>> f1_score(y_true, y_pred, average=None) array([0.8, 0. , 0. ]) >>> y_true = [0, 0, 0, 0, 0, 0] >>> y_pred = [0, 0, 0, 0, 0, 0] >>> f1_score(y_true, y_pred, zero_division=1) 1.0...
备注
当
true positive + false positive == 0时,precision 未定义;当true positive + false negative == 0时,recall 未定义。在这种情况下,默认情况下指标将被设为 0,f-score 也是如此,并且将引发UndefinedMetricWarning。此行为可以通过zero_division进行修改。