何时使用最小-最大标量和标准标量

问题描述 投票:5回答:2

当涉及到min-max-scalerStandard Scalar时。我认为这取决于数据。是否有任何数据特征需要考虑以决定采用哪种预处理方法。我看着docs,但有人可以给我更多的了解。

python-3.x scikit-learn
2个回答
0
投票

我希望这会有所帮助。何时使用MinMaxScaler,RobustScaler,StandardScaler和Normalizerhttps://towardsdatascience.com/scale-standardize-or-normalize-with-scikit-learn-6ccc7d176a02


0
投票

缩放比例的确取决于您将要使用的数据类型。在大多数情况下,StandardScaler是选择的缩放器。如果您知道有一些异常值,请选择RobustScaler

然后,您处理一些具有怪异分布的功能,例如数字,使用这些缩放器并不是最佳选择。确实,在此数据集上,有很多像素为零,这意味着您需要对该分布进行除以std的零拾取。开发。不会有好处。因此,基本上,当一个特征的分布远非正态分布时,则需要采取替代方法。

对于数字,MinMaxScaler是更好的选择。但是,如果您想将零保持为零(因为使用稀疏矩阵),则将使用MaxAbsScaler

注意:如果要使特征遵循正态分布/均匀分布,无论原始分布是什么,也请查看QuantileTransformerPowerTransformer

© www.soinside.com 2019 - 2024. All rights reserved.