如何从python中的完整数据集创建缺失值率(10%,20%等)

问题描述 投票:-4回答:1

任何人都可以告诉我如何创建具有不同百分比的缺失值的数据集,如python中原始数据集的(10%,20%)。

python missing-data
1个回答
0
投票

10%

import random
a_list = range(25)
print(random.sample(a_list,len(a_list) - len(a_list)//10))

但它并没有保留秩序

如果你需要保留订单

import random
a_list = range(25)
indexes = sorted(random.sample(range(len(a_list)),len(a_list)//10),reverse=True)
for i in indexes:
    del a_list[i]
print(a_list)

是一种方式。

如果你想要10%的几率掉落任何元素

new_list = [x for x in a_list if random.random()>0.1]
© www.soinside.com 2019 - 2024. All rights reserved.