所以,我有一个数据点列表,其中所有数据点都属于一个集群(每个项目是一个numpy数组,有3个功能(重新点一个点))。我计算它们的质心(点的平均值)。我想计算一个点与质心的标准偏差。更确切地说,我想知道离集群质心有多少标准偏差。请帮我编码。
我的数据点列表看起来像这样
([-5.75204079 8.78545302 8.00800119],....)
假设一个簇中的数据点存储在一个名为list
的data
中,下面的代码将计算该组数据的standard deviation
。
# Calculate mean
mean = sum(data)/len(data)
# Calculate sum of square of difference
# of data points from mean
dev = 0
for rec in data:
dev += pow((rec - mean),2)
# Calculate variance
var = dev/len(data)
# Calculate standard deviation
std_dev = math.sqrt(var)