binning 相关问题

binning是将数据分组为统计和数据分析中使用的“箱”的过程

如何在Matlab中有效地对数据进行装箱

我想根据一些“步骤”对一些数据进行分箱,此处为1:10。因此bin {1}应该包含值> = steps(1)&

回答 1 投票 0

Sklearn合并过程-可以返回一个间隔吗?

我正在尝试使用sklearn.preprocessing中的KBinsDiscretizer,但它返回的整数值为1,2,.. N(代表间隔)。是否可以返回正确的时间间隔为(0.2,0.5)或此...

回答 1 投票 0

通过DecisionTreeClassifier sklearn装箱数据?

假设我有一个数据集:X Y 20 0 22 0 24 1 27 0 30 1 40 1 20 0 ...我尝试通过最小化熵来离散X成几个二进制位。所以我 ...

回答 1 投票 3

箱的选择与相对较少的数据点直方图

考虑与matplotlib多个直方图这样一个情节:#!在/ usr / bin中/ env的python3进口matplotlib.pyplot如PLT进口随机#用于重现相同的种子。 random.seed(10586)...

回答 1 投票 0

熊猫GROUPBY与时间序列库计数

在样品数据帧数据= pd.DataFrame(np.random.rand(6,2),柱=列表( 'AB'))DTI = pd.date_range(开始= '2019年2月12日',结束='2019 -02-12' ,时段= 6)data.set_index(DTI,就地=真)的产率:...

回答 1 投票 0

如何在plotly或ggplot中绘制具有极其广泛传播的值/间隙的直方图

我正在用两个或多个相隔很远的模式绘制一些观察结果。我想有一个可以自动忽略差距的情节。观察的一个简单例子是obs = ......

回答 1 投票 0

bin中的bin和transpose

我仍然掌握着R和编码的概念,所以请耐心等待。我的问题这是一个降维的想法,我有三个步骤。前两个我需要帮助。 bin ...

回答 1 投票 2

使用np.digitize按bin分组数据

我正在寻找一种方法来平衡我在数组中的数据,基于它与某个像素的距离。为了达到这个目的,我制作了一个包含到中心距离的数组r。那里 ...

回答 1 投票 -1

绘制在散点图中的pandas数据框中分组的数据

我有大量的天文数据需要在散点图中绘制。我根据距离对数据进行了分类,我想并排绘制4个散点图。出于......的目的

回答 1 投票 0

使用scipy.stats.binned_statistic_2d计算2D数据的多个统计数字

我有一个关于函数scipy.stats.binned_statistic_2d的问题,如下所示:我有二维数据(x,y,f(x,y)),我想将xy平面分区并计算一些统计数据每个 ...

回答 1 投票 1

在Python中为每个bin分箱数据和计算MAE

我有两个数组:Obs =([])abs_error =([])我想用Obs来定义bin。例如,Where Obs为1到2,bin abs_error为bin#1。然后在Obs为2到3的地方,将bin abs_error bin到bin#2中。等......

回答 1 投票 0

Pandas pd.cut on Timestamps - “ValueError:bin必须单调增加”

我试图将时间序列数据分成标记的段,如下所示:将pandas导入为pd import numpy as np#创建库存值的示例DataFrame df = pd.DataFrame({'ticker':np.repeat([...

回答 1 投票 2

在R中重新绑定数据帧

我有一个数据框,它保存不同组(G)中多个科目(S)的跨时间(T)的活动(A)数据。每10分钟对活动数据进行采样。我想做的是......

回答 1 投票 0

python bin数据和返回bin中点(可能使用pandas.cut和qcut)

我可以让pandas cut / qcut函数返回bin端点或bin中点而不是bin标签字符串吗?目前pd.cut(pd.Series(np.arange(11)),bins = 5)0(-0.01,2] 1(-0.01,...

回答 3 投票 6

以每桶最小比例进行hpbin

我正在使用Proc HPBIN将我的数据拆分成等间距的桶,即每个桶具有相等比例的变量的总范围。我的问题是,当我有一个非常歪曲的数据...

回答 2 投票 0

确定R中特定级别的变量的平均值

我试图找到特定于我赋予不同变量的级别的变量的平均值(平均值)。到目前为止,我创建了一个与其相关的各种级别的新变量:级别1:...

回答 2 投票 0


R中的组/ bin / bucket数据,每桶获取计数和每个桶的值总和

我想桶/组/箱数据:C1 C2 C3 49488.01172 0.0512 54000 268221.1563 0.0128 34399 34775.96094 0.0128 54444 13046.98047 0.07241 61000 2121699.75 0 ....

回答 1 投票 9

在数据框上定义和应用自定义分档

使用python我创建了以下数据框,其中包含相似度值:cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0 ....

回答 4 投票 28

R help:确定间隔,binning一个数字

我试图在我之前拥有的值向量内的相邻值之间定义的间隔之间“嵌套”一些随机生成的数字。基本上,我有以下内容:vectorA ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.