如何调用粗化数据的过程使其更加真实？

问题描述投票：0回答：1

在我当前的项目中，我使用合成网格数据，为了使其更加真实，我添加了噪声并省略了一些测量，因为我不希望在真实网格中的任何地方都有数据测量。是否有一个既定的措辞来粗糙化合成数据以便更好地捕获真实数据？

到目前为止，我选择了“数据损害”，但感觉不太对劲，因为生成的数据相对于现实世界场景并没有受到损害。另一方面，“数据增强”也不适合这个，因为我没有通过这个过程获得更多数据。

举个例子：假设我有一个三节点网格 A-B-C，在某个时间点，相应的（合成）电压矢量可能如下所示 [2, 5, 3]，但是在现实场景中，我可能在节点 B 处没有测量结果并且存在一些噪声当测量节点 A 和 C 时。所以手头的向量看起来更像是这样的：[2.1, 0, 2.9]。为了测试我的网络在现实世界中的适用性，我想在第二类数据上训练它，从而转换第一类数据。

data-science

terminology

1个回答

0
投票

在没有数据形状以及计划如何处理数据（DNN、回归等）的具体示例的情况下，我参考了数据科学堆栈交换中的以下问题。一般来说，向数据添加噪声绝对是一种数据增强，以提高鲁棒性并减少过度拟合。将噪声添加到图像的亮度值中无论一天中的什么时间，图像识别算法都表现得更好。

省略数据通常是为了提取特征并产生更好的拟合（与前一种方法相反）。这有各种术语，仅举几个截断或特征选择。从这个意义上说，您的两种方法都可以称为“正则化”，但您的截断有不同的目的。也许运行一些测试来检查删除数据是否真的会产生更可靠的结果。

如何调用粗化数据的过程使其更加真实？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1