sampling 相关问题

在信号处理中,采样是将连续信号减少为离散信号。在统计学中,抽样是从统计总体中选择一部分个体来估计整个人口的特征。

在SAS中是否可以用另一个数据集的分层随机抽样?

我想比较两个数据集,一个属性的分层方式不同。是否可以在一个数据集中做分层随机抽样,但使用另一个数据集的分层?要说明的是,一个 ...

回答 1 投票 0

用另一个数据框架从一个数据框架中按组取样n行。

希望根据另一个数据框架的标准,从一个数据框架中按组随机抽取n行。例如:从g数据框中随机抽取n条记录。从ggplot2::mpg数据框中随机抽取基于制造商和......的行。

回答 1 投票 0

弹性搜索采样聚合 UNKNOWN KEY

目前正在使用Kibana处理60亿+文档,并试图根据 "索引"(即收集样本的特定日期)进行抽样。

回答 1 投票 1

从高斯分布中取样

我的问题很具体。给定一个有平均数和标准差的k维高斯分布,假设我想从这个分布中抽取10个点的样本。但是这10个样本应该是很 ...

回答 1 投票 0

Gibbs采样器无法收敛

我一直在尝试了解Gibbs采样。最近,我看了一段很有意义的视频。 https://www.youtube.com/watch?v=a_08GKWHFWo作者使用Gibbs采样来......>

回答 1 投票 1

如何在自定义函数中将参数传递给函数?

首先是代码片段:##来自sklearn.svm的程序包从sklearn.model_selection导入SVC,从sklearn.metrics导入train_test_split从imblearn.over_sampling导入...导入fbeta_score ...

回答 1 投票 0

模拟数据样本

我对每个组具有以下概率,并且每个组代表一定范围的值。我的目标是模拟与组和 百分比相对应的1,234行数据:...

回答 1 投票 0

从总体中采样固定数量的唯一对

我有n个元素的样本。我想从n中对m个唯一的对进行子采样。有没有简单的方法可以在python中做到这一点?例如,如果n = [1,2,3,4,5,6,7]且m = 3,则一个这样的样本...

回答 2 投票 1

如何在Python(统计模型或其他模型)中计算可检测的效应大小

我和平常有一个不同的问题。它与Python(或Excel,无论如何)中的功效和样本大小计算有关。在Python中,Statsmodels对于执行此操作很有用。例如,...

回答 1 投票 0

子采样数据,以便从包含N个类的巨大数据集中选择至少K个类

我有一个数据集,其中包含分类为109个类别的130万条记录。显然存在类别不平衡,数据中的最高类别为18%,最低类别小于1%现在,我的...

回答 1 投票 0

R中两个唯一类别的样本

我有100个唯一ID和8个独特星期。我想要抽样,以便我想要一个具有唯一ID和唯一星期的样本。例如,每周对ID 1进行8次采样,对ID 2进行8次采样,因此...

回答 1 投票 0

使用R随机分配参加者的日常治疗

问题:我正在尝试使用R生成随机研究设计,其中一半的参与者被随机分配给“治疗1”,另一半的参与者被分配给“治疗2”。 ...

回答 3 投票 8

根据数据生成随机样本

我在数据集中有506个点。我必须从该数据生成随机样本,例如我必须选择303个点而不进行替换,而剩下的203个点我需要从这303个点中选择...

回答 1 投票 0

R数据帧的更有效块重采样

我正在尝试以群集/阻止的方式对R数据帧进行重新采样。我正在使用下面的代码片段进行此操作,但是它的速度很慢:index_sample

回答 1 投票 0

scikit中的ShuffleSplit等效项

[sklearn.model_selection.ShuffleSplit的等效函数是什么,它可以保证所有折痕都不同?

回答 1 投票 1

如何计算R中某个比例的95%置信区间?

假设我拥有一家工厂,该工厂每天生产150颗螺钉,错误率为22%。现在,我要估计一年(365天)每天用rbinom(n = 365,大小...

回答 1 投票 0

在r中生成大量样本

我有一个50行4列的数据框。我想要获得12行的许多示例数据帧,可能是一百万行,并且我不希望我的两个示例数据帧相同。我用过...

回答 2 投票 0

Perf采样模式下检索程序执行时间

我在以下脚本中使用了Systemtap:

回答 1 投票 0

从与另一个列表没有共同元素的总体中生成随机样本列表

我希望从一个列表中抽样元素,以使该元素中的任何一个都不包含在另一个指定元素列表中。我希望继续生成新的样本,直到不相交的样本是...

回答 2 投票 0

如何使用逆CDF方法从逻辑CDF生成样本

我的问题是如何使用逆CDF方法从逻辑CDF生成R中的样本。 logistic密度为p(θ)= exp(θ)/(1 + exp(θ))^ 2这是该方法的算法:1:对于t = 1 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.