当涉及到min-max-scaler和Standard Scalar时。我认为这取决于数据。是否有任何数据特征需要考虑以决定采用哪种预处理方法。我看着docs,但有人可以给我更多的了解。
我希望这会有所帮助。何时使用MinMaxScaler,RobustScaler,StandardScaler和Normalizerhttps://towardsdatascience.com/scale-standardize-or-normalize-with-scikit-learn-6ccc7d176a02
缩放比例的确取决于您将要使用的数据类型。在大多数情况下,StandardScaler
是选择的缩放器。如果您知道有一些异常值,请选择RobustScaler
。
然后,您处理一些具有怪异分布的功能,例如数字,使用这些缩放器并不是最佳选择。确实,在此数据集上,有很多像素为零,这意味着您需要对该分布进行除以std的零拾取。开发。不会有好处。因此,基本上,当一个特征的分布远非正态分布时,则需要采取替代方法。
对于数字,MinMaxScaler
是更好的选择。但是,如果您想将零保持为零(因为使用稀疏矩阵),则将使用MaxAbsScaler
。
注意:如果要使特征遵循正态分布/均匀分布,无论原始分布是什么,也请查看QuantileTransformer
和PowerTransformer
。