sampling 相关问题

在信号处理中,采样是将连续信号减少为离散信号。在统计学中,抽样是从统计总体中选择一部分个体来估计整个人口的特征。

StratifiedShuffleSplit错误的输出?

我正在尝试基于分类变量“ Accident_Severity”(严重,严重或轻微)运行StratifiedShuffleSplit。初始分布:轻微182994严重40442 ...

回答 1 投票 0

生成大小偏斜的组,但其元素加到固定的总和

我的人数是固定的(例如1000)。我想将这1000人分为一些随机的类Y(例如5个),但不尽相同。我希望它们分布不均匀,...

回答 1 投票 0

SAS中按比例分组的子数据

在此数据中,我需要按一定百分比对每个变量进行子集化。例如,观察组分数1 A 1 2 A 2 3 B 1 4 B 1 5 C 3 6 C 1 7 C 1 8 A ...

回答 1 投票 0

绘图方法

假设我们正在制作一个程序,以将用户提供的函数(黑盒)的图形绘制为一系列线段。我们希望获得函数的最小样本数,因此...

回答 1 投票 0

Python Pandas-抽样:对随机选择项的数量进行限制

假设我有一个数据帧,看起来像:id_1 id_2 aa 123 bb 123 cc 234 dd 123 ee 678 FF 456 gg 123我该如何在最多只能有3个(...)的情况下进行采样(...

回答 1 投票 2

反正有找到一组点的平均质心吗?

我创建了一个随机样本点,并试图找到这些点的平均点位置并将其绘制在散点图上。有任何想法吗?这是我的代码:在此处输入图片描述

回答 1 投票 0

无折叠gibbs采样的引导式LDA

我正在使用Python软件包Guided-LDA进行折叠的gibbs采样[更多详细信息]。但是我想要没有折叠的吉布斯采样的引导式LDA。我怎样才能分开引导式LDA和折叠的gibbs ...

回答 1 投票 0

是否有可能从总体中生成10个样本,并重复采样1000次?

我正在尝试从一个种群中随机抽取10个人,并重复1000次。这可能吗?到目前为止,这是我的代码,我不确定自己是否走对了。我一直收到...

回答 1 投票 0


R中的分层k倍交叉验证

假设我有一个多类数据集(例如,iris)。我要执行分层的10折CV以测试模型性能。我在包splitstackchange中找到了一个名为stratified的函数,该函数是...

回答 1 投票 0

Azure App见解,自适应采样包含的类型不起作用

我想采样仅将自适应采样应用于“ Dependency” itemType。我使用下面的代码来实现这一目标,builder.UseAdaptiveSampling(maxTelemetryItemsPerSecond:250,includedTypes:“ Dependency”)...

回答 1 投票 1

相同日期,当我尝试从tweepy获取推文时

我正在尝试使用tweepy采样推文。例如,我想在今天4月14日到4月8日之间获得100条推文。但是当我尝试尝试时:`search_words =“ #COVID” date_until =“ 2020-04-09” tweets = twepy ....

回答 1 投票 0

随机选择具有指定概率的两个选项之一

我有两个子例程要执行,一个子例程的概率为p1,另一个子例程的概率为p2s.t。 p1 + p2 = 1,我正在通过以下方法解决该问题:比如说p1 = 0.6,p2 = 0.4,我需要执行...

回答 1 投票 1

如何为R中的多列创建分层抽样

我的数据集包含821049个变量和18列。我想抽取9列进行分层抽样。这些是“ BASKETS_NZ”,“ PIS”,“ PIS_AP”,“ PIS_DV”,“ PIS_PL”,“ PIS_SDV”,“ PIS_SHOPS”“ ...

回答 1 投票 0

在时间范围内随机选择20%

我有很多要分析的记录,但是没有足够的时间来浏览每个记录的全部。所以现在我想在R中做的就是在其中放入一个csv文档。带有文件名和...

回答 1 投票 0

从Dirichlet分布中进行采样的PyMC中的FloatingPointError

[使用修饰符定义“指数随机变量的对数”的随机对象失败后,我决定使用...]手动编写用于此新发行版的代码...

回答 2 投票 21

我如何对R中列表长度不相等的数据进行抽样和随机排列测试?

我有一个问题,其中有2个不等长的列表,我想对它们进行5000次迭代的随机置换测试,以查明两者的均值差异是否显着。 ...

回答 1 投票 0

简单的问题,但我陷在答案中

我们每秒使用8k次采样音频信号。每个样本显示128个不同的水平。存储2分钟的音频需要多少字节。我认为答案应该是8k / s * 120s * ...

回答 1 投票 0

从每个特定日期的非常特定的时间从DF中的列中查找值

我问了这个问题,我得到了一个答案,该答案适用于具有连续且不丢失数据的一般情况,但不适用于我的情况。我有一个看起来如下的DF。 eventTime ...

回答 1 投票 1


© www.soinside.com 2019 - 2024. All rights reserved.