下面的代码可以打印特定平均值和标准差的 PDF 图表。
现在我需要找到特定值的实际概率。例如,如果我的平均值为 0,并且我的值为 0,则我的概率为 1。这通常是通过计算曲线下面积来完成的。与此类似:
http://homepage.divms.uiowa.edu/~mbognar/applets/normal.html
我不知道如何解决这个问题
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
def normal(power, mean, std, val):
a = 1/(np.sqrt(2*np.pi)*std)
diff = np.abs(np.power(val-mean, power))
b = np.exp(-(diff)/(2*std*std))
return a*b
pdf_array = []
array = np.arange(-2,2,0.1)
print array
for i in array:
print i
pdf = normal(2, 0, 0.1, i)
print pdf
pdf_array.append(pdf)
plt.plot(array, pdf_array)
plt.ylabel('some numbers')
plt.axis([-2, 2, 0, 5])
plt.show()
print
除非您有理由自己实施此操作。所有这些功能都可以在 scipy.stats.norm
中找到我认为您要求 cdf,然后使用以下代码:
from scipy.stats import norm
print(norm.cdf(x, mean, std))
如果你想从头开始编写:
class PDF():
def __init__(self,mu=0, sigma=1):
self.mean = mu
self.stdev = sigma
self.data = []
def calculate_mean(self):
self.mean = sum(self.data) // len(self.data)
return self.mean
def calculate_stdev(self,sample=True):
if sample:
n = len(self.data)-1
else:
n = len(self.data)
mean = self.mean
sigma = 0
for el in self.data:
sigma += (el - mean)**2
sigma = math.sqrt(sigma / n)
self.stdev = sigma
return self.stdev
def pdf(self, x):
return (1.0 / (self.stdev * math.sqrt(2*math.pi))) * math.exp(-0.5*((x - self.mean) / self.stdev) ** 2)
从
y = f(x)
到x = a
的曲线x = b
下的面积与f(x)dx
从x = a
到x = b
的积分相同。 Scipy 有一种快速简单的积分方法。正如您所理解的,在该区域中找到单个点的概率不可能为 1,因为这个想法是曲线下的总面积为 1(除非它是 delta 函数)。因此,对于任何特定的兴趣值,您都应该获得 0 ≤ probability of value < 1
。可能有不同的方法,但传统的方法是沿 x 轴分配置信区间。在继续编码之前,我会阅读高斯曲线和归一化。