我有 31 个特征要输入到 ML 算法中。这 22 个特征值已经在 0 到 1 的范围内。其余 9 个特征在 0 到 750 之间变化。我的疑问是,如果我选择应用 MinMaxScaler() 并将范围设置为 (0,1),是应该对所有特征进行缩放还是仅对所需范围之外的 9 个特征进行缩放?什么比较合适?
最好缩放所有变量。
如果不缩放这 22 个特征,特征的缩放比例仍然会有所不同。
例如,这22个特征可能在0.2到0.7之间,但其他特征将在0到1之间(最小值将变为0,最大值将变为1)。
然后,在进行数学计算时,虽然 0.2 是特征的最小值,但它不是零,这会让学习变得困难。