列表的标准偏差

Question

我想找到几个（Z）列表的第1，第2，......数字的均值和标准差。例如，我有

A_rank=[0.8,0.4,1.2,3.7,2.6,5.8]
B_rank=[0.1,2.8,3.7,2.6,5,3.4]
C_Rank=[1.2,3.4,0.5,0.1,2.5,6.1]
# etc (up to Z_rank )...

现在我想取*_Rank[0]的平均值和标准，*_Rank[1]的平均值和标准值等。（即：所有（A..Z）_rank列表中第1位的平均值和标准值; 所有（A..Z）_rank列表中第二位数的平均值和标准值; 第三位数的平均值和标准数;等等）。

Answer 1

从Python 3.4 / PEP450开始，标准库中有一个statistics module，它有一个method stdev来计算像你这样的迭代的标准偏差：

>>> A_rank = [0.8, 0.4, 1.2, 3.7, 2.6, 5.8]
>>> import statistics
>>> statistics.stdev(A_rank)
2.0634114147853952

Answer 2

我会将A_Rank等放入2D NumPy阵列，然后使用numpy.mean()和numpy.std()来计算平均值和标准偏差：

In [17]: import numpy

In [18]: arr = numpy.array([A_rank, B_rank, C_rank])

In [20]: numpy.mean(arr, axis=0)
Out[20]: 
array([ 0.7       ,  2.2       ,  1.8       ,  2.13333333,  3.36666667,
        5.1       ])

In [21]: numpy.std(arr, axis=0)
Out[21]: 
array([ 0.45460606,  1.29614814,  1.37355985,  1.50628314,  1.15566239,
        1.2083046 ])

Answer 3

这里有一些纯Python代码可用于计算平均值和标准差。

下面的所有代码都基于Python 3.4+中的statistics模块。

def mean(data):
    """Return the sample arithmetic mean of data."""
    n = len(data)
    if n < 1:
        raise ValueError('mean requires at least one data point')
    return sum(data)/n # in Python 2 use sum(data)/float(n)

def _ss(data):
    """Return sum of square deviations of sequence data."""
    c = mean(data)
    ss = sum((x-c)**2 for x in data)
    return ss

def stddev(data, ddof=0):
    """Calculates the population standard deviation
    by default; specify ddof=1 to compute the sample
    standard deviation."""
    n = len(data)
    if n < 2:
        raise ValueError('variance requires at least two data points')
    ss = _ss(data)
    pvar = ss/(n-ddof)
    return pvar**0.5

注意：为了在求和浮点数时提高精度，statistics模块使用自定义函数_sum而不是我在其中使用的内置sum。

现在我们有例如：

>>> mean([1, 2, 3])
2.0
>>> stddev([1, 2, 3]) # population standard deviation
0.816496580927726
>>> stddev([1, 2, 3], ddof=1) # sample standard deviation
0.1

Answer 4

在Python 2.7.1中，您可以使用numpy.std()计算标准偏差：

人口标准：除了你的数据清单之外，只使用numpy.std()而没有其他参数。
示例std：您需要将ddof（即Delta Degree of Freedom）设置为1，如下例所示：

numpy.std（<your-list>，ddof = 1）

计算中使用的除数是N - ddof，其中N表示元素的数量。默认情况下，ddof为零。

它计算样本std而不是人口std。

Answer 5

在python 2.7中你可以使用NumPy的numpy.std()给出population standard deviation。

在Python 3.4中，statistics.stdev()返回样本标准偏差。 pstdv()函数与numpy.std()相同。

Answer 6

纯python代码：

from math import sqrt

def stddev(lst):
    mean = float(sum(lst)) / len(lst)
    return sqrt(float(reduce(lambda x, y: x + y, map(lambda x: (x - mean) ** 2, lst))) / len(lst))

Answer 7

其他答案涵盖了如何充分利用python中的std dev，但没有人解释如何进行你所描述的奇异遍历。

我将假设A-Z是整个人口。如果没有看到Ome关于如何从样本推断的答案。

因此，要获得每个列表的第一个数字的标准偏差/平均值，您需要这样的事情：

#standard deviation
numpy.std([A_rank[0], B_rank[0], C_rank[0], ..., Z_rank[0]])

#mean
numpy.mean([A_rank[0], B_rank[0], C_rank[0], ..., Z_rank[0]])

要缩短代码并将其概括为任何第n位，请使用我为您生成的以下函数：

def getAllNthRanks(n):
    return [A_rank[n], B_rank[n], C_rank[n], D_rank[n], E_rank[n], F_rank[n], G_rank[n], H_rank[n], I_rank[n], J_rank[n], K_rank[n], L_rank[n], M_rank[n], N_rank[n], O_rank[n], P_rank[n], Q_rank[n], R_rank[n], S_rank[n], T_rank[n], U_rank[n], V_rank[n], W_rank[n], X_rank[n], Y_rank[n], Z_rank[n]]

现在你可以简单地得到A-Z中所有第n个地方的标准和平均值，如下所示：

#standard deviation
numpy.std(getAllNthRanks(n))

#mean
numpy.mean(getAllNthRanks(n))

Answer 8

使用python，这里有几个方法：

import statistics as st

n = int(input())
data = list(map(int, input().split()))

Approach1 - using a function

stdev = st.pstdev(data)

Approach2: calculate variance and take square root of it

variance = st.pvariance(data)
devia = math.sqrt(variance)

Approach3: using basic math

mean = sum(data)/n
variance = sum([((x - mean) ** 2) for x in X]) / n
stddev = variance ** 0.5

print("{0:0.1f}".format(stddev))

Note:

variance计算样本总体的方差
pvariance计算整个人口的方差
stdev和pstdev之间存在类似差异

列表的标准偏差

问题描述投票：80回答：8

8个回答

Approach1 - using a function

Approach2: calculate variance and take square root of it

Approach3: using basic math

Note:

最新问题

列表的标准偏差

问题描述 投票：80回答：8

8个回答

Approach1 - using a function

Approach2: calculate variance and take square root of it

Approach3: using basic math

Note:

最新问题

问题描述投票：80回答：8