重采样是通过jackknifing或bootstrapping估计样本统计精度的各种方法中的任何一种。它还用于通过使用随机子集验证模型(引导,交叉验证)。
我正在研究多元时间序列异常检测,目前使用类似于“注意力就是你所需要的一切”论文中介绍的位置编码。然而,我面临着信息...
通过示例数据帧支付,我使用基本 R 进行引导。与经典引导的主要区别在于,一个样本可以有多行,必须全部包含在内。 有7个ID...
我有一个数据集,如下所示: 项目 城市 START_Y START_W FIRST_USE_Y FIRST_USE_W VALUE A 纽约 2023 30 2023 32 15000 一个...
如何使用rep_slice_sample()在不同观察数的组内随机采样
我正在为具有引导值的组构建置信区间,但在创建多个重新采样的数据集来构建置信区间时遇到了困难。 使用手掌彭...
时间序列交叉验证警告(tidymodels、fit_resamples)
我正在尝试使用 tidymodels 来运行时间序列交叉验证,并且一直在遵循 Tidy Modeling with R 章节(https://www.tmwr.org/resampling#rolling)。 感谢任何帮助,谢谢...
Tidymodels 和不平衡数据集 - 重采样时进行子采样
在处理不平衡数据集时,我的理解是可能的解决方案是对训练集进行二次采样或过采样。然而,测试集应该反映原始数据的不平衡...
我有一个小数据,其中有 3 组(A,B,C),每组 5 名参与者。所有这些参与者在 7 项不同的考试中每项都被测量 6 次,因此每个参与者得到 6*7=42 ...
我有以下时间序列数据: 图像 我想每月或每年对数据进行插值,我的代码如下: df = pd.read_csv('数据/data_processing.csv', 编码='latin1') df['日期'] ...
将 pandas 导入为 pd mydata = [{'ID' : '10', '进入日期': '10/10/2016', '退出日期': '15/10/2016'}, {'ID':'20','进入日期':'10/10/2016','退出日期':'18/10/2016'}] mydata2 = [{'ID...
我需要您的帮助来提高我的模型性能。正如大多数欺诈检测所发生的情况一样,我有一个不平衡的数据集 (0.1/0.9)。我想优化目标 1 和 0 的召回率,因为...
对 pandas DataFrame 中的时间序列进行上采样并进行插值
我有一个示例 DataFrame,其中采样频率 = 250 Hz(每 4 毫秒 1 个样本): df = 日期时间样本值 2000-01-01 00:00:00.004 56 2000-01-01 00:00:00.008 ...
我有一个关于如何使用引导程序包使用折刀的问题。我想获得折刀法的区间估计。 我尝试运行下面的代码,但没有结果
我目前正在尝试应用 Herrmann 等人中描述的重采样方法。 (2022) 具有外部和内部重采样循环: 我的数据集由 100 行 x 60 列组成。行对应...
我目前正在尝试应用 Herrmann 等人中描述的重采样方法。 (2022) 具有外部和内部重采样循环: 我的数据集由 100 行 x 60 列组成。行对应...
我需要对时间戳字段重新采样,但我没有使用 pandas 的重新采样方法取得成功。下表介绍了使用两种方法进行重采样:resample 和 groupby with ceil。有没有...
我正在编写一个Python脚本,用于一些几何数据操作(计算多驱动工业机器的运动轨迹)。一般来说,这个想法是有一个给定的形状(让我们......
我需要将二维数据重新采样为规则网格。 这就是我的代码的样子: 将 matplotlib.mlab 导入为 ml 将 numpy 导入为 np y = np.zeros((512,115)) x = np.zeros((512,115)) # 只是随机数据...
我之前运行过相同的代码(带有我需要的包)并且它有效,不知道现在发生了什么。这显示错误, AttributeError:模块“PIL.Image”没有属性“重新采样”。大概...
我正在尝试在 Python 上将 GeoTIFF 文件从代表 30m² 的像素重新采样到代表 1000m² 的像素。 我有一个 geotiff,它具有根据这些坐标的数据。空间分辨率...
使用 SimpleITK 重采样后,输出 MRI 图像的值(几乎)到处都是 0
我有 3 维 NIfTI MRI 图像,我想将其重新采样为统一的体素大小 (1, 1, 1)。这很好用: img = sitk.ReadImage(img_path) output_spacing = [1.0, 1.0, 1.0] 输入间距...