maxframe.learn.preprocessing.label_binarize#

maxframe.learn.preprocessing.label_binarize(y, *, classes, neg_label=0, pos_label=1, sparse_output=False, execute=False, session=None, run_kwargs=None)[源代码]#

以一对多的方式二值化标签。

scikit-learn 中提供了多种回归和二分类算法。将这些算法扩展到多类分类问题的一个简单方法是使用所谓的一对多方案。

该函数可以对预先已知的固定类别标签集进行此转换。

参数:

y (array-like) -- 要编码的整数标签序列或多标签数据。
classes (array-like of shape (n_classes,)) -- 为每个类别唯一保存标签。
neg_label (int, default=0) -- 负标签必须被编码为此值。
pos_label (int, default=1) -- 正标签必须被编码为此值。
sparse_output (bool, default=False,) -- 如果希望输出的二值数组为 CSR 稀疏格式，则设为 true。

返回:

Y -- 对于二分类问题，形状为 (n_samples, 1)。

返回类型:

{tensor, sparse tensor} of shape (n_samples, n_classes)

示例

>>> from maxframe.learn.preprocessing import label_binarize
>>> label_binarize([1, 6], classes=[1, 2, 4, 6])
array([[1, 0, 0, 0],
       [0, 0, 0, 1]])

类别顺序将被保留：

>>> label_binarize([1, 6], classes=[1, 6, 4, 2])
array([[1, 0, 0, 0],
       [0, 1, 0, 0]])

二分类目标将转换为列向量

>>> label_binarize(['yes', 'no', 'no', 'yes'], classes=['no', 'yes'])
array([[1],
       [0],
       [0],
       [1]])

参见

LabelBinarizer: 用于封装 label_binarize 功能的类，允许独立于转换操作来拟合类别。