什么样的神经网络架构对这类数据有好处?

问题描述 投票:-2回答:1

This is where data comes from and what is the expected output

在我的测试数据集中,A的半径约为0.5,X,Y的范围约为[0..10],A位于x = 9 y = 3

我生成了50K样本,其中10%是正数,并且找不到NN不会过度拟合的方法,并且在验证数据集上产生了一些合理的东西。我只尝试过密集的架构。

我知道输入乘法(解决图像上的方程所需)不是标准密集层的一部分,但可以用足够深的架构来实现。值得吗?或者我应该编写自己的图层(向量乘法)?分裂怎么样?

对NN来说这是一项好任务吗?也许有更好的输入数据编码?如果没有,什么是数据挖掘/机器学习领域的合适方法?

理想情况下,这是检测输入数据中隐藏变量依赖性的任务,它们可能很容易是非线性的(例如,3个点定义样条,假设2是最大功率)和噪声(例如,可能有20个点,因此Yi = 1.0当只有大约4个点形成交叉线时(所有数据集中相同的4个点,例如第1个,第3个,第9个和第10个))。我在哪里看?我问的太多了?

machine-learning neural-network deep-learning artificial-intelligence
1个回答
0
投票

对于NN来说,这应该是一项简单的任务。我认为这里的关键问题是防止过度拟合。鼓励先完成任务,然后解决烦恼问题。

Handling Overfitting

  1. 层数越少,每层的单位越少
  2. 正则化,如压差正则化,L2正则化
  3. 数据增加(基本上更多的训练数据)
  4. 提前停止(添加更好的停止标准)
  5. ...
© www.soinside.com 2019 - 2024. All rights reserved.