binning 相关问题

binning是将数据分组为统计和数据分析中使用的“箱”的过程

usmaps R:使用ggplot2设置bin并手动着色

我正在使用 R 中的 usmaps() 包来创建美国地图。我的数据设置如下: Ces_State_Only: 状态 1990年 阿拉巴马州 0.2 阿拉斯加州 0.31 亚利桑那 0.40 我想创建一张叶绿素图。我

回答 1 投票 0

在 R 中与 NA Group 进行合并

我一直在使用以下函数来创建偶数bin变量: ## Even Bins 函数 偶数箱 <- function(x, bin.count = 5, order = T) { bin.size <- rep(length(x) %/% bin.count, bin.co...

回答 2 投票 0

当数字数据与字符混合时如何对其进行分箱

假设我在 R 中有 3 列数据: 类型:'A' 'B' 'C' 'D' 'E' 'F' 'G' 值:UT 30 45 50 62 70 72 效率:70 72 80 88 90 92 98 我只想将“数值”数据放入“值”列中...

回答 1 投票 0

Python 中直方图的分箱

我有一个包含两列的文本文件,如下所示 0 0.0 1 2.4800279266728324e-06 2 9.823187699026918e-06 3 2.1883453405001393e-05 4 3.8513895910245685e-05 5 5.

回答 1 投票 0

如何在 Pandas 数据框中以对数尺度划分度数?

我想尽可能有效地将 Pandas 数据帧列的数量分类为对数刻度的度数。 通过对数刻度,我的意思是显示幂(单位,度)上的数字的方式......

回答 1 投票 0

如何使用 D3 创建等频(深度)箱?

您可以使用 D3 创建等宽的 bin,如下所示: 常量 arr = [0, 0, 1, 10, 100, 102, 200, 253, 10000] const bin_gen = d3.bin() const bins = bin_gen(arr) 将数据放入这些容器中: [ [ ...

回答 1 投票 0

如何取消之前为散点图分箱的长度数据

我有预装箱的长度数据,我正在尝试创建一个散点/抖动图,其中 x 轴上有日期,y 轴上有长度。这是一些示例数据: df<- as.data.frame(cbind(c(20:30), c(0,...

回答 1 投票 0

在 C 中对整数值进行装箱

我自己已经这样做了大约两个月,这是我自己编写的第一个独立程序。它对随机变量的行为进行建模。它绘制 SIZEA 个随机值

回答 1 投票 0

我在使用metawrap进行分箱时犯了一个错误

我的代码 metawrap 分箱-o bin_out -t 24 -m 200 -a all_contig/all_merge.fasta --metabat2 --maxbin2 --concot all_fastq/*fastq 报错如下 对 SRR10492802 比对文件进行排序 [

回答 1 投票 0

在 Pandas 中,如何对浮点数进行装箱并对来自其他列的字符串类型进行计数,其中装箱具有恒定大小的滚动、重叠的数字范围?

我有一个浮点值和字符串表,如下所示: 福尔特值 类别 0.01 A 0.02 A 0.05 乙 0.31 乙 0.36 A 0.37 C 0.41 乙 我想生成一个新的数据框来存储浮动

回答 1 投票 0

对不同大小的 x 值标准化 geom_密度

我有一个由两个不同测量值组成的数据集,它们在不同样本(a 和 b)中测量的值(我们称之为高度和宽度)有很大不同。我想说明一下...

回答 1 投票 0

Pandas:将类别转换为数字

假设我有一个包含国家/地区的数据框,如下所示: 抄送 |温度 美国 | 37.0 加州 | 12.0 美国 | 35.0 非盟 | 20.0 我知道有一个 pd.get_dummies 函数可以将国家/地区转换为“one-hot encod”...

回答 6 投票 0

如何在gnuplot或python中进行数据分箱?

我正在尝试用Python进行数据分箱。我想要得到的图是original_graph。但我得到了 my_plot。我想将数据分入纬度范围为 2 度和

回答 1 投票 0

使用 Pandas DataFrames 按天对设备的状态时间进行分箱

我有一个 Pandas 数据帧,其中包含电源启用/禁用命令与时间的关系。该索引目前尚未使用。您可以使用以下命令自行创建它: pd.DataFrame( {'命令时间戳':{ ...

回答 1 投票 0

numpy.digitize 返回的值超出范围?

我使用以下代码将数组数字化为 16 个容器: numpy.digitize(数组,bins=numpy.histogram(数组,bins=16)[1]) 我期望输出在 [1, 16] 范围内,因为有 1...

回答 4 投票 0

(R) 将数字列装箱以计算 group by 后的出现次数

如果帖子标题有点令人困惑,我们深表歉意。假设我有以下数据框: 设置.种子(123) 测试<- data.frame("chr" = rep("chr1",30), "position"...

回答 1 投票 0

使用 Pandas 进行分箱和可视化

所以我正在尝试为我的数据框创建一个年龄间隔列: df['age_interval'] = pd.cut(x=df['Age'], bins=[18, 22, 27, 32, 37, 42, 47, 52, 57, 60], include_lowest=True) 我添加了图表: P...

回答 2 投票 0

基于两列的 Bin pandas 数据框

我有大的文本文件,我需要基于两列进行分箱,然后为每个分箱中的行总和和每个分箱中的行的索引添加两个新列。我之前问过这个问题......

回答 3 投票 0

在 R 的数据框中是否有一个函数或循环来分箱 50 多个分类和连续变量列?

我有一个 R 数据框,它包含 75 列的分类变量和连续变量。我正在尝试找到一种有效地对每个变量进行分类的方法。是 for 循环的方法,如果是,那是什么...

回答 0 投票 0

使用python的逻辑语句将房价分门别类。

我试图将一些房屋价格类别进行分类,以便将它们叠加在地图上,以显示社区价格差异。当我把这个逻辑组合在一起,把不同的住房价格分类时,我......。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.