根据分布情况从列表中选择元素

问题描述 投票:0回答:1

我有一个列表,其中包含的数字是非常不同的,彼此是:

[85, 1966, 1135, 1602, 1225, 35460, 829, 12532, 1923, 4091, 113, 7592, 2011, 2179, 886, 18451, 3069, 6400, 9228, 1215, 5, 6484, 1947, 786, 21121, 28, 9917, 24747, 20798, 36051,16670, 169, 4497, 32262, 33, 25348, 19127, 1354, 26]

有没有可能只提取10个元素,但这些元素在初始值的分布上尽可能具有代表性?

我缺乏数学背景,所以这是我还没有尝试的原因。因为我不知道从哪里开始。

python list python-2.7 distribution
1个回答
1
投票

在数据中可以有很多不同的分布,其中有随机性。也就是说,10个数字不能正确地呈现整个数字列表。然而,你可以尝试做的事情是,首先要 sort 榜上有名 sample 从列表中按相同的区间取10个数字。你可能会注意到,这种方法通过几率告诉你,你的数据是否处于均匀分布。如果不是,你可以告诉你,如果数据有左偏度或右偏度。这将在一定程度上为你提供信息。

除了天真的方法外,我建议通过统计学来研究它们的属性,如均值、模数、中位数、最小值、最大值、量子值等,用 describe 函数从包 pandas 是某地的一个开始。

© www.soinside.com 2019 - 2024. All rights reserved.