我有代表相对计数(0.0-1.0)的数据,如下例所示。用公式
计算cell value(E.g.23)/sum of the colum(E.g. 1200) = 0.01916
示例数据
f1 f2 f3 f5 f6 f7 f8 class
0.266 0.133 0.200 0.133 0.066 0.133 0.066 1
0.250 0.130 0.080 0.160 0.002 0.300 0.111 0
0.000 0.830 0.180 0.016 0.002 0.059 0.080 1
0.300 0.430 0.078 0.100 0.082 0.150 0.170 0
在应用深度学习算法之前,我删除了显示高相关性的特征。
归一化时我很困惑,哪种方法在模型生成之前是正确的。
因为,当我使用经典监督算法时,最小-最大和z缩放可提高性能。但是在使用“ TensorFlow-GPU”进行深度学习的情况下,我看不到两者之间有任何显着差异。
谢谢。
当数据大致呈正态分布时,z缩放是一个好主意,通常是这种情况。
最小-最大缩放是正确的做法,当您期望大致均匀的分布时。
总之,这取决于您的数据和神经网络。
但是两者都对异常值敏感,您可以尝试疯狂中位数缩放。