binning是将数据分组为统计和数据分析中使用的“箱”的过程
我想根据一些“步骤”对一些数据进行分箱,此处为1:10。因此bin {1}应该包含值> = steps(1)&
我正在尝试使用sklearn.preprocessing中的KBinsDiscretizer,但它返回的整数值为1,2,.. N(代表间隔)。是否可以返回正确的时间间隔为(0.2,0.5)或此...
通过DecisionTreeClassifier sklearn装箱数据?
假设我有一个数据集:X Y 20 0 22 0 24 1 27 0 30 1 40 1 20 0 ...我尝试通过最小化熵来离散X成几个二进制位。所以我 ...
考虑与matplotlib多个直方图这样一个情节:#!在/ usr / bin中/ env的python3进口matplotlib.pyplot如PLT进口随机#用于重现相同的种子。 random.seed(10586)...
在样品数据帧数据= pd.DataFrame(np.random.rand(6,2),柱=列表( 'AB'))DTI = pd.date_range(开始= '2019年2月12日',结束='2019 -02-12' ,时段= 6)data.set_index(DTI,就地=真)的产率:...
如何在plotly或ggplot中绘制具有极其广泛传播的值/间隙的直方图
我正在用两个或多个相隔很远的模式绘制一些观察结果。我想有一个可以自动忽略差距的情节。观察的一个简单例子是obs = ......
我仍然掌握着R和编码的概念,所以请耐心等待。我的问题这是一个降维的想法,我有三个步骤。前两个我需要帮助。 bin ...
我正在寻找一种方法来平衡我在数组中的数据,基于它与某个像素的距离。为了达到这个目的,我制作了一个包含到中心距离的数组r。那里 ...
我有大量的天文数据需要在散点图中绘制。我根据距离对数据进行了分类,我想并排绘制4个散点图。出于......的目的
使用scipy.stats.binned_statistic_2d计算2D数据的多个统计数字
我有一个关于函数scipy.stats.binned_statistic_2d的问题,如下所示:我有二维数据(x,y,f(x,y)),我想将xy平面分区并计算一些统计数据每个 ...
我有两个数组:Obs =([])abs_error =([])我想用Obs来定义bin。例如,Where Obs为1到2,bin abs_error为bin#1。然后在Obs为2到3的地方,将bin abs_error bin到bin#2中。等......
Pandas pd.cut on Timestamps - “ValueError:bin必须单调增加”
我试图将时间序列数据分成标记的段,如下所示:将pandas导入为pd import numpy as np#创建库存值的示例DataFrame df = pd.DataFrame({'ticker':np.repeat([...
python bin数据和返回bin中点(可能使用pandas.cut和qcut)
我可以让pandas cut / qcut函数返回bin端点或bin中点而不是bin标签字符串吗?目前pd.cut(pd.Series(np.arange(11)),bins = 5)0(-0.01,2] 1(-0.01,...
我正在使用Proc HPBIN将我的数据拆分成等间距的桶,即每个桶具有相等比例的变量的总范围。我的问题是,当我有一个非常歪曲的数据...
我试图找到特定于我赋予不同变量的级别的变量的平均值(平均值)。到目前为止,我创建了一个与其相关的各种级别的新变量:级别1:...
R中的组/ bin / bucket数据,每桶获取计数和每个桶的值总和
我想桶/组/箱数据:C1 C2 C3 49488.01172 0.0512 54000 268221.1563 0.0128 34399 34775.96094 0.0128 54444 13046.98047 0.07241 61000 2121699.75 0 ....
使用python我创建了以下数据框,其中包含相似度值:cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0 ....
我试图在我之前拥有的值向量内的相邻值之间定义的间隔之间“嵌套”一些随机生成的数字。基本上,我有以下内容:vectorA ...