Keras-使用大量特征

问题描述 投票:0回答:1

我正在开发Keras NN,它使用20,000个特征来预测标签。我可以建立网络,但是必须使用系统RAM,因为模型太大而无法放入我的GPU中,这意味着要花几天的时间才能在计算机上运行模型。输入当前为500,20000,1到输出500,1,1

-我在第一个完全连接的(密集)层中使用5,000个节点。这足以满足功能需求吗?-是否有降低尺寸的方法以便在我的GPU上运行?

python machine-learning keras keras-layer tf.keras
1个回答
0
投票

我想每个输入条目的大小为(20000, 1),您有500个组成数据库的条目?

在那种情况下,您可以从降低batch_size开始,但是我还假设您的意思是即使网络权重也不适合您的GPU内存。在那种情况下,(我知道)唯一可以做的就是降维。

您有20000个功能,但是所有这些功能对于输出值都很重要。使用PCA(主成分分析),您可以检查所有参数的重要性,并且您可能会发现,只有少数几个参数对最终结果的重要性达到90%或更高。在这种情况下,您可以忽略不重要的功能,并创建一个仅基于1000个(甚至更少)功能来预测输出的网络。

[重要说明:我能想到的地方需要很多功能的唯一原因是,如果要处理图像,光谱(可以将光谱视为一维图像)……在这种情况下我建议研究卷积神经网络。它们没有完全连接,因此删除了许多可训练的参数,而性能可能更好。

© www.soinside.com 2019 - 2024. All rights reserved.