maxframe.learn.preprocessing.MinMaxScaler#

class maxframe.learn.preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True, clip=False, validate=True)[源代码]#

通过将每个特征缩放到给定范围来转换特征。

该估计器单独缩放和平移每个特征，使其在训练集上的取值处于给定范围内，例如在0和1之间。

变换公式如下:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中 min, max = feature_range。

这种变换通常作为零均值、单位方差缩放的替代方法。

更多内容请参见用户指南。

参数:

feature_range (tuple (min, max), default=(0, 1)) -- 变换后数据的期望范围。
copy (bool, default=True) -- 设为 False 以执行原地行归一化并避免复制（如果输入已经是 numpy 数组）。
clip (bool, default=False) -- 设为 True 以将保留数据的变换值裁剪到提供的 feature range。

min_#

每个特征的最小值调整。等价于 min - X.min(axis=0) * self.scale_

类型:: 形状为 (n_features,) 的张量

scale_#

每个特征数据的相对缩放。等价于 (max - min) / (X.max(axis=0) - X.min(axis=0))

类型:: 形状为 (n_features,) 的张量

data_min_#

数据中每个特征的最小值

类型:: 形状为 (n_features,) 的 ndarray

data_max_#

数据中每个特征的最大值

类型:: 形状为 (n_features,) 的 ndarray

data_range_#

数据中每个特征的范围 (data_max_ - data_min_)

类型:: 形状为 (n_features,) 的 ndarray

n_samples_seen_#

估计器处理的样本数。在新的 fit 调用时会重置，但在 partial_fit 调用之间会递增。

类型:: 整数

示例

>>> from maxframe.learn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

参见

minmax_scale: 不使用估计器 API 的等效函数。

备注

NaN 被视为缺失值：在 fit 中忽略，在 transform 中保留。

有关不同缩放器、变换器和归一化器的比较，请参见 examples/preprocessing/plot_all_scaling.py。

__init__(feature_range=(0, 1), copy=True, clip=False, validate=True)[源代码]#

方法

`__init__`([feature_range, copy, clip, validate])
`execute`([session, run_kwargs, extra_tileables])
`fetch`([session, run_kwargs])
`fit`(X[, y, execute, session, run_kwargs])	计算用于后续缩放的最小值和最大值。
`fit_transform`(X[, y])	拟合数据，然后对其进行转换。
`inverse_transform`(X[, execute, session, ...])	根据 feature_range 对 X 进行反向缩放。
`partial_fit`(X[, y, execute, session, run_kwargs])	对 X 在线计算最小值和最大值以供后续缩放使用。
`transform`(X[, execute, session, run_kwargs])	根据 feature_range 缩放 X 的特征。