Keras-使用大量特征

问题描述投票：0回答：1

我正在开发Keras NN，它使用20,000个特征来预测标签。我可以建立网络，但是必须使用系统RAM，因为模型太大而无法放入我的GPU中，这意味着要花几天的时间才能在计算机上运行模型。输入当前为500,20000,1到输出500,1,1

-我在第一个完全连接的（密集）层中使用5,000个节点。这足以满足功能需求吗？-是否有降低尺寸的方法以便在我的GPU上运行？

python

machine-learning

keras

keras-layer

tf.keras

1个回答

0
投票

我想每个输入条目的大小为(20000, 1)，您有500个组成数据库的条目？

在那种情况下，您可以从降低batch_size开始，但是我还假设您的意思是即使网络权重也不适合您的GPU内存。在那种情况下，（我知道）唯一可以做的就是降维。

您有20000个功能，但是所有这些功能对于输出值都很重要。使用PCA（主成分分析），您可以检查所有参数的重要性，并且您可能会发现，只有少数几个参数对最终结果的重要性达到90％或更高。在这种情况下，您可以忽略不重要的功能，并创建一个仅基于1000个（甚至更少）功能来预测输出的网络。

[重要说明：我能想到的地方需要很多功能的唯一原因是，如果要处理图像，光谱（可以将光谱视为一维图像）……在这种情况下我建议研究卷积神经网络。它们没有完全连接，因此删除了许多可训练的参数，而性能可能更好。