Statsmodels是一个Python模块,允许用户浏览数据,估计统计模型和执行统计测试。
同一组One Hot Encoded变量中不同的VIF分数意味着什么?
这是我从每组中删除一个热编码变量以避免虚拟变量陷阱后得到的列的 VIF 表。 在这里您可以看到 EducationField_Life Sciences 的 VIF ...
似乎 scipy 曾经提供了一个 mad 函数来计算一组数字的平均绝对偏差: http://projects.scipy.org/scipy/browser/trunk/scipy/stats/models/utils.py?rev=3473 然而...
是否有现有函数可以从 Pandas 或 Statsmodels 估计固定效应(单向或双向)。 Statsmodels 中曾经有一个功能,但似乎已停止使用。在 Pandas 中,有
我们可以创建 ECDF 将 numpy 导入为 np 从 statsmodels.distributions.empirical_distribution 导入 ECDF ecdf = ECDF([3, 3, 1, 4]) 并在点处获得 ECDF ecdf(x) 然而,...
Python 的 statsmodels 库有 get_rdataset() 方法,可以获取各种数据集。可以获取的数据集列表在哪里?如何使用它来加载数据集? 文档中没有
对于链接中的示例,我还想获得一个类似于 SAS 中的方差分析表,其中有源 (模型、误差、总计)、DF、平方和、均方、F价值和...
我必须从 OLS statsmodel 摘要中提取信息。执行此操作时,汇总的峰度结果与数组方法 kurtosis() 不同。 这是代码: 来自 sklearn.da...
我有一个物体,它是 statsmodels.genmod.generalized_linear_model.GLMResultsWrapper statsmodels.regression.linear_model.RegressionResultsWrapper statsmodels.base.elastic_net.
我尝试在pypy环境中安装statsmodel: pypy -mpip 安装 statsmodels 我得到的错误: 程序 python 找到:是 (C:\Program Files\pypy\pypy3.9-v7.3.9-win64\pypy.exe) 运行时间取决于...
我正在做一个多重假设修正的项目(使用python)。我找到了一个很棒的函数,它包含在 statsmodel 包中。 statsmodels.stats.multitest.multiple...
我一直在使用 statsmodels 来创建线性回归模型。我正在尝试打印摘要数据。对于 OLS,所需的函数是 .summary(),但是,我已经对模型进行了正则化: 型号=...
Statsmodelsseasonal_decompose - 它有什么天真之处?
一直在Python中处理时间序列,并使用sm.tsa.seasonal_decompose。在文档中,他们介绍了这样的功能: 我们在同一vei中添加了一个简单的季节性分解工具......
ValueError:形状 (100,2) 和 (100,2) 未对齐:2(暗淡 1)!= 100(暗淡 0)
以下是我的代码: 将 numpy 导入为 np 将 pandas 导入为 pd 将 statsmodels.api 导入为 sm # 生成虚拟数据 np.随机.种子(123) X = np.random.normal(大小=(100, 5)) y1 = np.random.normal(si...
numpy.average() 有权重选项,但 numpy.std() 没有。有人对解决方法有建议吗?
检查对象是否是一组类(statsmodel 或 sklearn)的实例
我有一个物体,它是 statsmodels.genmod.generalized_linear_model.GLMResultsWrapper statsmodels.regression.linear_model.RegressionResultsWrapper statsmodels.base.elastic_net.
Conda 与 Python3.9 在 Python3.10 中使用 numpy
我正在尝试在 Conda 环境中的 Oracle Machine Learning 中安装 statsmodels。 我的康达版本是: %康达 信息 活动环境:无 外壳等级:0 用户配置文件:/...
如何通过 PySpark DF 使用 statsmodels 中的seasonal_decompose / 如何将 DataFrame 转换为时间序列数组
我有一个包含两列的spark Dataframe(time_key,日期和数量之间间隔7天),就像这样: 时间键 数量 2023-10-26 10 2023-10-19 12 2023-10-12 14 我正在尝试使用 fu...
我需要将内生变量 Y 回归到外生变量 X 上。Y 如下所示: 编号 0 1 2 ... 22 23 24 日期...
我想获得 scipy 函数 scipy.optimize.curve_fit() 背后的一些直觉。下面,我写了一个简单的版本,试图最小化最小二乘函数之和(权重均为1),
尽管使用频率重新索引,但 ARIMA 模型出现“无法在没有频率的情况下将积分值添加到时间戳”错误
我正在尝试使用 ARIMA 模型对此系列进行时间序列预测: 1960年1月1日 12.7 1961-01-01 12.1 1962年1月1日 12.7 1963年1月1日 12.8 1964年1月1日 12.3 1965-01-01 13.0 196...