何时使用最小-最大标量和标准标量

问题描述投票：5回答：2

当涉及到min-max-scaler和Standard Scalar时。我认为这取决于数据。是否有任何数据特征需要考虑以决定采用哪种预处理方法。我看着docs，但有人可以给我更多的了解。

python-3.x

scikit-learn

2个回答

0
投票

我希望这会有所帮助。何时使用MinMaxScaler，RobustScaler，StandardScaler和Normalizerhttps://towardsdatascience.com/scale-standardize-or-normalize-with-scikit-learn-6ccc7d176a02

0
投票

缩放比例的确取决于您将要使用的数据类型。在大多数情况下，StandardScaler是选择的缩放器。如果您知道有一些异常值，请选择RobustScaler。

然后，您处理一些具有怪异分布的功能，例如数字，使用这些缩放器并不是最佳选择。确实，在此数据集上，有很多像素为零，这意味着您需要对该分布进行除以std的零拾取。开发。不会有好处。因此，基本上，当一个特征的分布远非正态分布时，则需要采取替代方法。

对于数字，MinMaxScaler是更好的选择。但是，如果您想将零保持为零（因为使用稀疏矩阵），则将使用MaxAbsScaler。

注意：如果要使特征遵循正态分布/均匀分布，无论原始分布是什么，也请查看QuantileTransformer和PowerTransformer。