在http://stats.stackexchange.com上考虑您的问题是否会更好。统计学是使用概率从有限数量的样本或观察中推断人口特征的数学研究。
我已经解决了以下程序,以从用户的输入中获取平均值和标准差,但我有强烈的感觉可以改进,主要是因为我必须复制 split 函数,我必须这样做
我有一本这样的计数字典: {1:2, 2:1, 3:1} 我需要由此计算 q1、中位数和 q3。对于奇数数组来说这是非常简单的,但对于偶数情况,我似乎无法
我想确定我所使用的数据集的假设是否是独立同分布的。实际上是有效的(对于任意数据集,可能由图像组成)。有没有什么半正派的独立措施...
我正在使用 QGIS 中的栅格计算器将多个栅格网格添加在一起,但我的输出文件在图例层的范围内显示非常大的值,例如340,282,346,638,528,859,811,70...
如何用区间数据绘制百分位图? 请参阅下面的代码以根据特定间隔计算数据的百分位数。 idx = pd.IntervalIndex.from_breaks([39.9, 42.9,45.9,48.9,51.9,54....
如何使用 pandas 计算下面间隔频率数据的标准差? idx = pd.IntervalIndex.from_breaks([105, 110, 115, 120, 125, 130, 135]) df = pd.DataFrame({"Bin&...
为什么 pd.cut 会产生 NaN 值? 输入 s = pd.Series(np.arange(6)) df = pd.DataFrame({'Bin': pd.cut(s, [105, 110, 115, 120, 125, 130]), ‘频率’:[2,5,6,8,8,1]}) df 输出
TL;DR:如何使用 Numpy 正确绘制 np.histogram(..., Density=True) 的结果? 使用密度 = True 应该有助于匹配样本的直方图和底层的密度函数
我有一个对数正态分布的样本集,想要对其进行拟合。然后我想将样本的直方图和拟合的 PDF 绘制到一个图中,并且我想使用原始的
在 scipy.stats.mannwhitneyu 中使用数组列表和单个数组之间的区别
我一直在修改 scipy.stats.mannwhitneyu 函数,但恐怕我不太明白应该使用什么输入。我尝试阅读 scipy 网站上的文档(https://docs.
就上下文而言,我试图找到一种方法来设置分布的偏度,导致我得出偏度正态分布,该分布在其累积分布函数中使用 Owen 的 T。搜索后...
我正在尝试使用 lcsm 包拟合两个时间点的双变量潜在变化评分模型,但遇到错误。 当我尝试提取拟合统计数据时,出现以下错误: 呃...
如何向使用 pd.cut 创建的 df 添加列? s = pd.Series(np.arange(10)) df = pd.cut(s, [-5, 0, 5, 10] ) df["频率"] = pd.Series(np.arange(10)) df 输出是atta...
在 Julia 中生成用 2 个值填充固定向量的所有可能组合
我想生成一个可迭代对象,它可以计算用二进制值填充向量的所有可能方法。最好是可迭代的,因为我随后需要应用选择标准...
我有很多样本 (y_i, (a_i, b_i, c_i)),其中 y 被假定为 a、b、c 中的多项式在一定程度上变化。例如,对于给定的一组数据和 2 度,我可能会生成模型 ...
使用密度 = True 应该有助于匹配样本的直方图和基础随机变量的密度函数,但事实并非如此: 将 numpy 导入为 np 导入 scipy.stats 导入 matplot...
我正在尝试使用线性混合模型进行模拟研究。作为一个例子,为了呈现我所面临的相同错误,我在这里发布使用 Orth 的模型结构......
我想获得 scipy 函数 scipy.optimize.curve_fit() 背后的一些直觉。下面,我写了一个简单的版本,试图最小化最小二乘函数之和(权重均为1),
如何在Python中使用exasol数据库中的大表进行统计分析?
我有一个包含 3600 万行的表,我需要运行不同的统计分析(例如假设检验、分布分析等)。 因为当我使用export_to_pandas时出现内存错误
我有一个像这样的简单数据框 data_umur = data.frame( kategori_umur = c("18-23", "23-28", "28-33", "33-38","38-43", "43-48", "...