来自石榴贝叶斯网络的样本

问题描述 投票:0回答:3

我使用石榴中的

from_samples()
构建了一个贝叶斯网络。我可以使用
model.predict()
从模型中获得最大可能的预测。我想知道是否有一种方法可以有条件(或无条件)从这个贝叶斯网络中采样?即是否从网络中获取随机样本而不是最大可能的预测?

我看了

model.sample()
,但它正在升高
NotImplementedError

此外,如果使用

pomegranate
无法做到这一点,还有哪些其他库非常适合 Python 中的贝叶斯网络?

python machine-learning python-3.5 bayesian-networks pomegranate
3个回答
3
投票

只是为了用一个具体的例子来阐明上述答案,以便对某人有所帮助,让我们从以下简单的数据集(有 4 个变量和 5 个数据点)开始:

import pandas as pd
df = pd.DataFrame({'A':[0,0,0,1,0], 'B':[0,0,1,0,0], 'C':[1,1,0,0,1], 'D':[0,1,0,1,1]})
df.head()

#   A   B   C   D
#0  0   0   1   0
#1  0   0   1   1
#2  0   1   0   0
#3  1   0   0   1
#4  0   0   1   1 

现在让我们使用

'exact'
算法和
pomegranate
从上面的数据中学习贝叶斯网络结构(使用DP/A*来学习最优的BN结构),使用以下代码片段

import numpy as np
from pomegranate.bayesian_network import *
model = BayesianNetwork.from_samples(df.to_numpy(), state_names=df.columns.values, algorithm='exact')
# model.plot()

所学习的BN结构以及相应的CPT如下图所示

从上图可以看出,它准确地解释了数据。我们可以使用模型计算数据的对数似然,如下所示:

np.sum(model.log_probability(df.to_numpy()))
# -7.253364813857112

一旦学习了 BN 结构,我们就可以按如下方式从 BN 中采样:

model.sample()  
# array([[0, 1, 0, 0]], dtype=int64)

顺便说明一下,如果我们使用

algorithm='chow-liu'
来代替(它可以快速逼近找到树状结构),我们将获得以下 BN:

这次数据的对数似然为

np.sum(model.log_probability(df.to_numpy()))
# -8.386987635761297

这表明算法

exact
找到了更好的估计。


0
投票

如果我正确地看到提交历史记录,

model.sample()
现在应该已经实现了

您可以查看PyMC,它也支持分布混合。 但是,我不知道有任何其他工具箱具有类似的工厂方法,例如 pomogranate 中的

from_samples()


0
投票

从“烘焙”贝叶斯网络中采样的一种方法是使用 Predict_proba 方法。 Predict_proba 返回与未提供信息的每个节点相对应的分布列表,以所提供的信息为条件。

例如:

bn = BayesianNetwork.from_samples(X)
proba = bn.predict_proba({"1":1,"2":0}) # proba will be an array of dists
samples = np.empty_like(proba)
for i in np.arange(proba.shape[0]):
    for j in np.arange(proba.shape[1]):
        if hasattr(proba[i][j],'sample'):
            samples[i,j] = proba[i][j].sample(10000).mean() #sample and aggregate however you want
        else:
            samples[i,j] = proba[i][j]
pd.Series(samples,index=X.columns) #convert samples to a pandas.Series with column labels as index
© www.soinside.com 2019 - 2024. All rights reserved.