binning 相关问题

binning是将数据分组为统计和数据分析中使用的“箱”的过程

在所有数据框列上应用具有不同bin大小的合并

我有一个琐碎的问题。我有一个很大的df,有很多列。我正在尝试找到最有效的方法来对具有不同bin大小的所有列进行装箱并创建新的df。这是一个...

回答 1 投票 2

Pandas数据框-在多列上合并并在另一列上获取统计信息

问题我有一个目标变量x以及一些其他变量A和B。我想在满足A和B的某些条件时计算x的平均值(和其他统计量)。一个真实的例子...

回答 3 投票 6

panda df迭代,基于时间的数据装箱(以毫秒为单位)

我重新提出了问题的重点,并尝试尽可能具体。在下面,我还包括到目前为止使用的代码; (1)从SQL中提取数据时,我的时间是一种混合格式,其中包含...

回答 1 投票 -1

Python:如何创建日期时间数组,并在合并之前为数组中的每个索引提取相应的年,月,日,小时

我可以创建如下所示的1994年至2020年之间的日期时间列表:from datetime import datetime,timedelta#创建用于绘制start_date = datetime(1994,1,1)start_date_yr = start_date的日期时间。...] >>

回答 1 投票 0

通过pandas.cut()函数创建垃圾箱后,如何有效地将每个值标记到垃圾箱?

说我在数据框中有一个'user_age'列,我通过类似以下方式创建了'user_age_bin':df ['user_age_bin'] = pd.cut(df ['user_age'],bins = [10, 15,20,25,30])在模型推断中,...

回答 1 投票 1

大熊猫在多个条件下的Bin平均

问题我有一个目标变量x以及一些其他变量A和B。我想在满足A和B的某些条件时计算x的平均值(和其他统计量)。一个真实的例子...

回答 1 投票 1

合并范围内所有x值,然后取每个bin中所有y值的均值的最佳方法?

我有一个x,y坐标列表。 x值靠近但不相同。我想将x值在一个范围内合并在一起,然后取每个bin中y值的平均值。我...

回答 1 投票 0

通过在R中的列上聚合来重构不等值存储桶中的值

我有一个看起来像下面的数据集:| | ID |姓名| Date_diff | | ---- |:-----:| ----------:| | 50 |大卫| 0 | | 50 |大卫| -16 | | 50 |大卫| -4 | | 50 |大卫| -...

回答 2 投票 1

仅包含Spotfire中具有AutoBinNumeric()的特定行

[嗨,Spotfire专业人员,我正在尝试为包含34个唯一列和69个唯一行标识符的大型矩形数据框(> 2M行)制作一组动态直方图,然后...>

回答 1 投票 0

在python中创建函数以对数据进行装箱

我有1000行2列的数据。一列包含CustomerID,另一列包含值。我需要创建一个函数来将值分为5组。我需要使用的分箱过程如下。 ...

回答 1 投票 -1

Google图表直方图的公式

[Google图表使用什么公式构建直方图?例如,它是否使用Sturge规则?杜恩的法则?斯科特的法则?等等。是否有任何文档说明如何构造它的默认bin ...

回答 1 投票 1

如何根据字符串列表对字符串值进行装箱?

是否有一种方法可以将STRINGS的pandas列分类为自定义名称的自定义组。类似于cuts函数,但适用于字符串。例如,也许使用列表列表来定义哪些组...

回答 2 投票 0


用于特征工程的分组和装箱数据

我努力将我的数据划分为用于特征工程的分类。数据是我要按类别数据分组的销售价格(邻里)。我在做什么错-我得到了所有...的NaN值...

回答 1 投票 0

Python-创建使用x和y边界定义的自定义垃圾箱

我想在此图中创建(例如)此图中的空间垃圾箱:这里有412个垃圾箱,但这取决于我想要多少个垃圾箱(https://arxiv.org/pdf/1909.04701.pdf )。我...

回答 1 投票 1

使用pd.Bin限制超出范围(用Nand替换“ Max_val”)

df = pd.DataFrame({'days':[0,31,45,35,19,70,80]})df ['range'] = pd.cut(df.days,[0,30, 60])df在此处复制代码,其中pd.cut用于将数字列转换为分类列。]]

回答 1 投票 0

如何知道数字是否在R中的确定间隔中

我有一个包含3列的数据集:默认,高度和重量。我对变量进行了装箱,并在列表中将其变通了(我必须这样做)。每个装箱都有关联,但现在我...

回答 1 投票 0

如何匹配具有不同bin大小的两个离散值列表?

我在24小时内都有两个DataFrame,其中包括2列(Timestamp和Consumption)。第一个DataFrame中的数据每8秒记录一次,第二个DataFrame中的数据为...

回答 1 投票 0

具有非均匀数组的bin平均值

我有一组非均匀速度剖面(速度与高度),我需要对所有剖面进行平均(1 km剖面)。这是三个“合成”配置文件的示例:testalt1 = np.arange(70,...

回答 1 投票 0

我如何对熊猫系列进行装箱,将每个装箱的箱尺寸设置为最大/最小预设值

我有一个pd.float系列,我想将其分装到n个分箱中,在其中设置了每个分箱的分箱大小,以使max / min为预设值(例如1.20)?该要求意味着...

回答 3 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.