df 相关问题


使用 R 中的 ggraph 包排列和着色圆圈

我有一个数据框df: df 输出(df) 结构(列表(组= c(“根”,“根”,“NS2A”,“NS2A”,“NS2A”, “NS5”、“NS5”、“NS5&...


在 R 中使用 gsub 替换字符串 + [重复]

这是我的 df: df <- data.frame(a = as.character(c("AB+CD+EF", "GH+IJ+KL")), x = c(1,2) ) df a x 1 AB+CD+EF 1 2 GH+IJ+KL 2 When I replace the string "+" by &


动态 AND 计算分组依据

说,我有以下内容 # 虚拟数据 df <- data.table(metric_1 = c(1,1,3) , metric_2 = c(1,2,2) ); df metric_1 metric_2 1: 1 1 2: 1 ...


根据单一条件改变几列

df <- data.frame(x=1:10) Can I mutate several columns based on a single condition? For example, I can do this: df %>% 变异(y = if_else(x>3,"Y","N"), z = if_else(x>...


在另一个列表中计算一个列表中的元素

df 是这样的: df <- data.frame( groups=I(list(c("a"), c("b","c", "d", "e","f"), c("g","h"), c("i&quo...


使用 Z - Score 方法删除 pandas 数据框中具有异常值的行

我正在使用此代码来删除异常值。 将 pandas 导入为 pd 将 numpy 导入为 np 从 scipy 导入统计数据 df = pd.DataFrame(np.random.randn(100, 3)) df[np.abs(stats.zscore(df[0])) < 1.5] This wo...


新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...


Python 新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...


dplyr:用最后一列的数据进行变异

我想使用数据框最后一列的数据创建一个新列: df <- matrix(1:4, ncol = 2) %>% as.data.frame() df %>% 变异(V3 = .[[ncol(.)]] * 2) 有没有更容易重...


获取每个组值的列表列表,而无需在 pandas 中旋转表格

我有以下数据框: 将 numpy 导入为 np 将 pandas 导入为 pd 数据 = np.random.uniform(0, 1, (4, 5)) df = pd.DataFrame(数据, 列 = [2010,2011,2012,2013,2014]) df = df.stack().reset_ind...


如何在 pandas 中的特定列索引处插入列?

我可以在 pandas 的特定列索引处插入列吗? 将 pandas 导入为 pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 这会将第 n 列作为...的最后一列


对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df,有 50 种 A 和 B 的独特组合。 对于 A 和 B 的每种组合,我想执行 Kruskal-wallis 测试: kruskal.test(D,C,data = df) 我想测试哪些组合 A 和...


如果 A 的子字符串位于一个 DF 的 B 字符串中,则不选择行

我有一个带有“员工通用名称”和“显示名称”的 df,如果“员工通用名称”位于“显示名称”内,我不想选择该行。 我有...


根据df2中两列间隔的值填充df1中的pandas列

我正在尝试填写包含离散样本深度(样本df)的数据框中的空列。我想扫描包含深度间隔的第二个数据帧(间隔 df)并检查 wh...


使用 R 对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df,有 50 种 A 和 B 的独特组合。 对于 A 和 B 的每种组合,我想执行 Kruskal-wallis 测试: kruskal.test(D,C,data = df) 我想测试哪些组合 A a...


使用grepl过滤特定范围列中的列名

我有一个 df 包含这样的 colnames: [1]“lab_id”“周”“组” [4]“级别”“id_row”...


ttkcalendar 在 python pandas df 中用于 Oracle 查询中的日期范围

先生 我成功地将所有 Oracle 11gr2 数据获取到 DF,但现在我想使用 tkinter 日历 date1 和 ttkcalendar 的 date1 根据用户给定的日期范围获取数据。 这两个怎么用


如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示: >> df.列 输出: MultiIndex([('月份', nan), (“TG”,...


如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示: >> df.列 输出: MultiIndex([('月份', nan), (“TG”,...


Pandas 数据框使用特定列的 interpolate() 分区

我有以下 Pandas 数据框(称为 df)。 +--------+--------+------+--------+ |人 |动物 |年份|数量 | +--------+--------+------+--------+ |约翰 |狗 | 2000 | 2000 2 | |...


创建数字范围作为数据框的列

我的数据框是: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': [20, 100], 'b': [2, 3], 'dir': ['长', '短'] } ) 预期输出:创建列...


在 Python 中合并 DataFrame 列

我有一个特殊的数据框,称为 df 这是它的样子 RepID +Col01 +Col02 +Col03 -Col01 +Col04 +Col05 -Col03 -Col04 +Col06 -Col07 1 5 7 9 8 3 8...


按顺序分配正值和负值的位置

假设我有以下数据框: df = 小标题( 季度 = c(seq.Date(as.Date("2022-03-01"), as.Date("2023-12-01"), "季度")), 值 = c(rnorm(3)...


如何在具有初始值的 mutate 中使用滞后/超前?

样本df: 图书馆(tidyverse) 鸢尾花 <- iris[1:10,] iris$testlag <- NA iris[[1,"testlag"]] <- 5 Sepal.Length Sepal.Width Petal.Length Petal.Width Species testlag 1 5.1 ...


与类型平均值的偏差

我有一个像这样的 df: 结构(列表(日期 = 结构(c(18605, 18604, 18598, 18597, 18590、18584、18583、18578、18570、18569、18563、18562、18557、 18549、18548、18542、18541、18536、18534、18529、


删除 r 中数据帧内的所有小于符号

我有一个包含小于符号的数据框: 第 1 列 <- c(1,5,"<4",3,2,9) col2 <- c(1,7,"<3",1,0,"<9") df <- data.frame(col1,col2) I try to rem...


如何从Python中的matplotlib饼图获取颜色映射?

来自 pandas 关于从数据框创建饼图的文档: 我有以下代码: df = pd.DataFrame({'质量': [0.330, 4.87 , 5.97], ‘半径’: [2439.7, 6051.8, 6378.1]}...


如何调用Python类中的函数

我有一个Python类,其中有嵌套函数。我无法调用嵌套的函数。 类数据: __实例__ = 无 def writeCleanData(df,路径,d_path,行,天数,lk): ...


pandas 重新索引多重索引无法正常工作

我有一个 pandas(版本 1.0.5)DataFrame,具有两个级别的 MultiIndex,例如喜欢: mi = pd.MultiIndex.from_product((('a', 'c'), (5, 12))) np.随机.种子(123) df = pd.DataFrame(data=np.random.ran...


将包含日期的列按月拆分为多列。 SQL

我正在尝试根据月份验证登录的用户。 SQL 当前df 用户 ID 日期 P1302 2023-11-01 P1302 2023-10-01 P1302 2023-09-01 P1302 ...


如何从前面的其他列中减去特定列的平均值?

我想从数据集中前 3 列的每个值中减去每个“空白”列的平均值,如下所示: df <- data.frame(da=1:5...


查找其中一列发生移动的两列之间的最大值

我的数据框是: 将 pandas 导入为 pd df = pd.DataFrame( { “一”:[20,9,31,40], 'b': [1, 10, 17, 30], } ) 预期输出:创建列 c ABC 0 20 1 20 1 9...


DT::DTOutput 仅在第一行放置样式

我有一个数据框df。我想知道是否可以仅在第一行添加样式,我想突出显示计算缺失值的行,并且我希望在


模块“pandas”没有属性“read_csv

将 pandas 导入为 pd df = pd.read_csv('FBI-CRIME11.csv') 打印(df.head()) 运行这个简单的代码会出现错误: 回溯(最近一次调用最后一次): 文件“C:/Users/Dita/Desktop/python/les...


前一天数据填写N/A

我有一个数据框,它只有工作日的数据。以下是示例数据框: 将 pandas 导入为 pd df = pd.DataFrame({'BAS_DT': ['2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05', '2023-01-05 ...


在 R 中查找多列中的字符串

我有多个列,其中包含相似的数据,并且我有多个单词,我想知道它们是否在其中一列中。 举个例子 : df = data.frame(ttt1= c("METO",&q...


Pyspark - 按列表循环数据帧列

pyspark 新手。只是尝试简单地循环变量列表中存在的列。这是我尝试过的,但不起作用。 列列表 = ['colA','colB','colC'] 对于 df 中的 col: 如果 col 在


JUNIT 测试用例-Spark JDBC

我是 Java 编程的新手。我有一个从Oracle数据库读取数据的方法。现在我需要帮助使用 JUnit 框架为以下代码编写测试用例。 数据集 df = Spark.read().


合并索引上的两个数据帧,去掉 key_0

我想通过索引列合并两个数据帧。我的代码是: 将 pandas 导入为 pd 将 numpy 导入为 np df1 = pd.DataFrame({'a': ['红色', '红色', '红色']}) df2 = pd.DataFrame({'b': [1, 2, 2]}) df = ...


将 R 中 3 个变量的总和重新调整为恰好等于 1

我有一个如下数据框,其中有 3 列,每列代表在单个活动中花费的时间比例。 df <- data.frame(ID = c(1, 2, 3, 4), (time_1 = c(0.25...


如何系统地根据列位置对列进行操作?

有没有一种方法可以根据列的位置系统地划分列? 例如,使用这样的数据框: df <- data.frame(id = ('a1', 'a2'), a = c(1, 0), b = c(4,0), c = c(4, 3...


np.select 将所有真实值连接在一起

我有一个数据框,想检查每一行我的条件是否正确。如果 multiple 为真,我想用 np.select 返回所有这些选择。我怎样才能做到这一点? df = pd。


找到两列之间的最大值,其中其中一列被移动并更改最后一行的值

我的数据框是: df = pd.DataFrame( { “一”:[20,9,31,40], 'b': [1, 10, 17, 30], } ) 预期输出:创建列 c 和名称 a b c 名字 0 20 1 20 南 1...


Pandas:df 的每一行中的值的平均值,但仅限于使用正则表达式过滤的选定列范围

鉴于我的df id 权重 项目 Exp_type 研究员 events_d1 events_d2 events_d3 events_d4 events_d5 0 50 p1 急性亚历克斯 0 0 0 4 2...


这是重命名 Polars DF 列的最高效方法吗?

问题: 我有一个列名,可以根据某些函数参数更改其前缀和后缀,但列名的一部分始终是相同的。我需要将该列重命名为


在 geom_boxplot 中取消对齐过度绘制的异常值

我有一个向量,其中有一些重要的异常值,总共 5 个。只有 3 个异常值是不同的。因此,相同的值会在 geom_boxplot 中过度绘制: df <- data.frame( Ratio = c(r...


如何检查数据帧列中的所有非 nan 值是否 > 0?

我有一个数据框列,可能有 NaN,这是可以接受的,但非正值是不可接受的。 我尝试做 断言 (df[col] > 0).all() 但这断言是否存在 nan co...


Pandas groupby.head(-n) 删除一些组

我有一个如下所示的 df: 对于每个 reviewerID,我想选择最后 2 个实例(按 reviewTime 排序)作为测试数据,其余的(最多最后 2 个实例)作为训练数据集。这是我的代码...


查找同时包含数字和字符串数据类型的特定列中的最大值

我有一个 df,其中包含一列(例如“经度”),其中包含数字和字符串数据类型。 例如:[5,“高”,“3”] 我想更改包含...的行


组合两个条目顺序不匹配的数据帧

我有 2 个数据帧,称为 df 和 df2 ,下面显示了两者的一个小示例。我想通过“公式”列 df2 匹配数据帧的条目,将两者连接成一个组合数据帧...


© www.soinside.com 2019 - 2024. All rights reserved.