我正在研究时间序列数据集,因此在拟合GaussianMixture()
包中的scikit-learn
函数时,我需要使每个特征(时间戳)依赖。但是,在检查源代码后,我找不到用于自定义协方差矩阵的参数。
凭借我有限的统计知识,我很好奇如何在E步骤中修改协方差矩阵,将时间依赖性纳入GMM模型。非常感谢你。
这是源代码:我想要做的更改是在estimate_gaussian_parameters()函数中https://github.com/scikit-learn/scikit-learn/blob/7389dba/sklearn/mixture/gaussian_mixture.py#L435
在darksky的帮助下,我学会了该函数是内置的协方差矩阵选项。参数covariance_type有4个选项:'full'(每个组件都有自己的一般协方差矩阵),'tied'(所有组件共享相同的一般协方差矩阵),'diag'(每个组件都有自己的对角协方差矩阵),'球形'(每个组件都有自己的单一方差)。
在我的理解中,'球形'用于单变量数据集,'diag'用于具有多变量但独立的特征的数据集。因此,如果他们想要预测多变量和依赖特征,应该使用“完整”或“绑定”。