binning 相关问题

binning是将数据分组为统计和数据分析中使用的“箱”的过程

使用python的逻辑语句将房价分门别类。

我试图将一些房屋价格类别进行分类,以便将它们叠加在地图上,以显示社区价格差异。当我把这个逻辑组合在一起,把不同的住房价格分类时,我......。

回答 1 投票 0

PowerBI 基于测量值的动态分选(范围变化)。

我想通过分片来表示一些连续数据。一个区域的连续权重数据应该被分选为。VeryHigh, High, Low, VeryLow. 权重值是基于一个交互 ...

回答 1 投票 1

Python: 如何在( value_min, value_max ] 上绘制数据。

我有一个巨大的数据集,我想让我们说的bin和绘图。因为当我绘制原始数据时,它看起来像这样... ... 一个非常丑陋的情节。基于此我生成了平均值,标准值和大小... ...

回答 2 投票 0

如何根据分仓的共同条件来识别分仓事件?(scipy.binned_statistic)

我是用scipy.binned_statistic来获取一个bin内的点的频率,如:h,xedges,yedges,img = hist = plt.hist2d(X,Y,bins=(160,160),norm=mpl.cols.LogNorm(vmin=1,vmax=20))我 ...

回答 1 投票 0

如何根据分仓的共同条件来识别分仓事件?(scipy.binned_statistic)

我是用scipy.binned_statistic来获取一个bin内的点的频率,如:h, xedge, yedge, binindex = scipy.stats.binned_statistic_2d(X, Y, Y, statistic='mean', bins=160) 我能够 ...

回答 1 投票 0

返回计数大于阈值的所有分仓的数据指数。

我试图找到的指数都在某个bin内的数据binned喜欢这样: import numpy as np x=np.random.random(1000) y=np.random.random(1000) #bin不是均匀的间隔,不......

回答 1 投票 1

我正在尝试将列中的单元格替换为“> 3days”和“ 3days”,但通过R编写的代码不正确

我正在使用以下代码尝试替换数据帧列中的单元格:DMS_Sync_Report $ Valid.Last.Sync ... Temp。

回答 1 投票 0

我如何调用optbinning模块获取所有可变binning的结果

现在,我使用optbinning模块对所有逻辑回归建模变量进行分箱。但是optbinning模块只需要使用一个变量,例如variable =“ REGION_POPULATION_RELATIVE” x = df [...

回答 1 投票 1

基于python中的值来禁止文件

我正在尝试将值分类到用于我的数据的某些自定义分类中。数据帧中的Coulmn1由一大组从1.4到1.9的随机数组成。假设初始数据帧看起来...

回答 1 投票 0

同时输出pandas binning中的bins和labels列

我有一个要在其上进行装箱的dataframe列,例如:df.head X 4.6 2.5 3.1 1.7我希望将一列用于bin范围,将一列用作标签,如下所示:df.head X。 ..

回答 1 投票 0

R中按分组的分组

我有一个与市场,零售商和销售有关的数据框。我需要将每个市场中的零售商分成5个分位数。例如:dataframe

回答 1 投票 0

创建具有不同bin大小的bin值字典-python

我想创建一个具有不同bin大小和增量的bin值字典。例如,起始增量是5到10(例如0-5、6-10),然后是10到100(例如...

回答 1 投票 0

如何将数据分类为shapefile的六边形并进行绘制?

我对R还是这个网站都是陌生的。我目前的发行项目遇到了麻烦。我的目标是创建一个基于六边形的地图,这些六边形具有基于不同属性的颜色渐变....

回答 1 投票 0

Pandas:有效地用代表值替换合并的列

我想对数据进行分类并为每个分类选择一个特定的聚合。将大熊猫作为pd df = pd.DataFrame({'A':[1,2,3,4],'B':[1,2,3,4],})组= pd.cut(df [' A'],bins = 2,labels = False)...

回答 1 投票 1

以y轴表示频率多边形的最大值的百分比

给定代码set.seed(1234)dat

回答 1 投票 0

Pandas df:不同列中的组,箱和平均值?

我的数据从本质上看起来像这个虚拟表格:speed_observation,car_brand,traction_force 10,ford,2 20,ford,4 35,seat,8 50,ford,16 10,audi,2 20,audi,5、43奥迪,2月12日,座位,...

回答 2 投票 0

在Weka中通过/未通过学校成绩的二进制分类

我正在使用Weka进行数据挖掘。我的数据正在考虑学校等级(数字输出介于0和20之间)。我希望按照二进制分类对成绩进行建模(如果成绩> = 10,则为“通过”,否则为“不及格”)...

回答 1 投票 0

是否可以为每行数据创建唯一的bin?

我有一个数据集,其中包含多个对象的最小和最大高度。数据帧如下所示:ID最小值最大值A 30 160 B 12 200 C 35 171 D 16 198我想分割...

回答 1 投票 0

scipy.stats.binned_statistic_dd()仓位编号有很多额外的仓位

我正在努力处理scipy.stats.binned_statistic_dd()结果。我有一个位置数组和另一个ID数组,分别在3个方向上进行分箱。我提供了bin边缘的列表,如...

回答 1 投票 0

二维np。数字化

我有二维数据,我有一堆用scipy.stats.binned_statistic_2d生成的二维箱。对于每个数据点,我都希望它占用bin的索引。这正是...

回答 1 投票 6

© www.soinside.com 2019 - 2024. All rights reserved.