如何调用粗化数据的过程使其更加真实?

问题描述 投票:0回答:1

在我当前的项目中,我使用合成网格数据,为了使其更加真实,我添加了噪声并省略了一些测量,因为我不希望在真实网格中的任何地方都有数据测量。是否有一个既定的措辞来粗糙化合成数据以便更好地捕获真实数据?

到目前为止,我选择了“数据损害”,但感觉不太对劲,因为生成的数据相对于现实世界场景并没有受到损害。另一方面,“数据增强”也不适合这个,因为我没有通过这个过程获得更多数据。

举个例子: 假设我有一个三节点网格 A-B-C,在某个时间点,相应的(合成)电压矢量可能如下所示 [2, 5, 3],但是在现实场景中,我可能在节点 B 处没有测量结果并且存在一些噪声当测量节点 A 和 C 时。所以手头的向量看起来更像是这样的:[2.1, 0, 2.9]。为了测试我的网络在现实世界中的适用性,我想在第二类数据上训练它,从而转换第一类数据。

data-science terminology
1个回答
0
投票

在没有数据形状以及计划如何处理数据(DNN、回归等)的具体示例的情况下,我参考了数据科学堆栈交换中的以下问题。一般来说,向数据添加噪声绝对是一种数据增强,以提高鲁棒性并减少过度拟合。将噪声添加到图像的亮度值中无论一天中的什么时间,图像识别算法都表现得更好。

省略数据通常是为了提取特征并产生更好的拟合(与前一种方法相反)。这有各种术语,仅举几个截断特征选择。从这个意义上说,您的两种方法都可以称为“正则化”,但您的截断有不同的目的。也许运行一些测试来检查删除数据是否真的会产生更可靠的结果。

© www.soinside.com 2019 - 2024. All rights reserved.