拆分R中的数据,拆分为百分比

问题描述 投票:0回答:1

我有一个与不同类型数据集对应的数据集。然后如何计算案例。

数据应分为一种情况:1)第一种情况 - 15%的列车数据和5%的测试

如何正确写?

r percentage
1个回答
0
投票

没有createDataPartition,一个简单的方法将如下。

假设你想要train_prop作为训练集,test_prop作为数据集my_dataset的测试集。理想情况下,他们的总和将是1,或1-val_prop,但在这里你需要15%和5%由于某种原因。所以你分别需要0.15和0.05。

indices <- sample(x = rep.int(x = c(0, 1, 2),
                  times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]
© www.soinside.com 2019 - 2024. All rights reserved.