任何人都可以告诉我如何创建具有不同百分比的缺失值的数据集,如python中原始数据集的(10%,20%)。
10%
import random
a_list = range(25)
print(random.sample(a_list,len(a_list) - len(a_list)//10))
但它并没有保留秩序
如果你需要保留订单
import random
a_list = range(25)
indexes = sorted(random.sample(range(len(a_list)),len(a_list)//10),reverse=True)
for i in indexes:
del a_list[i]
print(a_list)
是一种方式。
如果你想要10%的几率掉落任何元素
new_list = [x for x in a_list if random.random()>0.1]