df 相关问题

我有一个数据框df： df 输出(df) 结构（列表（组= c（“根”，“根”，“NS2A”，“NS2A”，“NS2A”， “NS5”、“NS5”、“NS5&...

这是我的 df： df <- data.frame(a = as.character(c("AB+CD+EF", "GH+IJ+KL")), x = c(1,2) ) df a x 1 AB+CD+EF 1 2 GH+IJ+KL 2 When I replace the string "+" by &

动态 AND 计算分组依据

说，我有以下内容 # 虚拟数据 df <- data.table(metric_1 = c(1,1,3) , metric_2 = c(1,2,2) ); df metric_1 metric_2 1: 1 1 2: 1 ...

根据单一条件改变几列

df <- data.frame(x=1:10) Can I mutate several columns based on a single condition? For example, I can do this: df %>% 变异(y = if_else(x>3,"Y","N"), z = if_else(x>...

在另一个列表中计算一个列表中的元素

df 是这样的： df <- data.frame( groups=I(list(c("a"), c("b","c", "d", "e","f"), c("g","h"), c("i&quo...

使用 Z - Score 方法删除 pandas 数据框中具有异常值的行

我正在使用此代码来删除异常值。将 pandas 导入为 pd 将 numpy 导入为 np 从 scipy 导入统计数据 df = pd.DataFrame(np.random.randn(100, 3)) df[np.abs(stats.zscore(df[0])) < 1.5] This wo...

新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...

Python 新的总计列未显示在 df.info() 中

我使用添加了总计列 df['总计'] = df[列表(df.columns)].sum(axis=1) 我的数据框是 H1 H2 H3 合计 1.643910e+10 5.403600e+09 1.090...

dplyr：用最后一列的数据进行变异

我想使用数据框最后一列的数据创建一个新列： df <- matrix(1:4, ncol = 2) %>% as.data.frame() df %>% 变异(V3 = .[[ncol(.)]] * 2) 有没有更容易重...

获取每个组值的列表列表，而无需在 pandas 中旋转表格

我有以下数据框：将 numpy 导入为 np 将 pandas 导入为 pd 数据 = np.random.uniform(0, 1, (4, 5)) df = pd.DataFrame(数据, 列 = [2010,2011,2012,2013,2014]) df = df.stack().reset_ind...

如何在 pandas 中的特定列索引处插入列？

我可以在 pandas 的特定列索引处插入列吗？将 pandas 导入为 pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 这会将第 n 列作为...的最后一列

对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df，有 50 种 A 和 B 的独特组合。对于 A 和 B 的每种组合，我想执行 Kruskal-wallis 测试： kruskal.test(D,C,data = df) 我想测试哪些组合 A 和...

如果 A 的子字符串位于一个 DF 的 B 字符串中，则不选择行

我有一个带有“员工通用名称”和“显示名称”的 df，如果“员工通用名称”位于“显示名称”内，我不想选择该行。我有...

根据df2中两列间隔的值填充df1中的pandas列

我正在尝试填写包含离散样本深度（样本df）的数据框中的空列。我想扫描包含深度间隔的第二个数据帧（间隔 df）并检查 wh...

使用 R 对数据框中的大量组合执行 Kruskal-wallis 测试

我在 R 中有一个 df，有 50 种 A 和 B 的独特组合。对于 A 和 B 的每种组合，我想执行 Kruskal-wallis 测试： kruskal.test(D,C,data = df) 我想测试哪些组合 A a...

使用grepl过滤特定范围列中的列名

我有一个 df 包含这样的 colnames： [1]“lab_id”“周”“组” [4]“级别”“id_row”...

ttkcalendar 在 python pandas df 中用于 Oracle 查询中的日期范围

先生我成功地将所有 Oracle 11gr2 数据获取到 DF，但现在我想使用 tkinter 日历 date1 和 ttkcalendar 的 date1 根据用户给定的日期范围获取数据。这两个怎么用

如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示： >> df.列输出： MultiIndex([('月份', nan), （“TG”，...

如何在多索引 pandas 数据框中填充列名称

我的数据框列如下所示： >> df.列输出： MultiIndex([('月份', nan), （“TG”，...

Pandas 数据框使用特定列的 interpolate() 分区

我有以下 Pandas 数据框（称为 df）。 +--------+--------+------+--------+ |人 |动物 |年份|数量 | +--------+--------+------+--------+ |约翰 |狗 | 2000 | 2000 2 | |...

创建数字范围作为数据框的列

我的数据框是：将 pandas 导入为 pd df = pd.DataFrame( { 'a': [20, 100], 'b': [2, 3], 'dir': ['长', '短'] } ）预期输出：创建列...

在 Python 中合并 DataFrame 列

我有一个特殊的数据框，称为 df 这是它的样子 RepID +Col01 +Col02 +Col03 -Col01 +Col04 +Col05 -Col03 -Col04 +Col06 -Col07 1 5 7 9 8 3 8...

按顺序分配正值和负值的位置

假设我有以下数据框： df = 小标题（季度 = c(seq.Date(as.Date("2022-03-01"), as.Date("2023-12-01"), "季度")), 值 = c(rnorm(3)...

如何在具有初始值的 mutate 中使用滞后/超前？

样本df：图书馆（tidyverse）鸢尾花 <- iris[1:10,] iris$testlag <- NA iris[[1,"testlag"]] <- 5 Sepal.Length Sepal.Width Petal.Length Petal.Width Species testlag 1 5.1 ...

与类型平均值的偏差

我有一个像这样的 df：结构（列表（日期 = 结构（c（18605, 18604, 18598, 18597, 18590、18584、18583、18578、18570、18569、18563、18562、18557、 18549、18548、18542、18541、18536、18534、18529、

删除 r 中数据帧内的所有小于符号

我有一个包含小于符号的数据框：第 1 列 <- c(1,5,"<4",3,2,9) col2 <- c(1,7,"<3",1,0,"<9") df <- data.frame(col1,col2) I try to rem...

如何从Python中的matplotlib饼图获取颜色映射？

来自 pandas 关于从数据框创建饼图的文档：我有以下代码： df = pd.DataFrame({'质量': [0.330, 4.87 , 5.97], ‘半径’: [2439.7, 6051.8, 6378.1]}...

如何调用Python类中的函数

我有一个Python类，其中有嵌套函数。我无法调用嵌套的函数。类数据： __实例__ = 无 def writeCleanData(df,路径,d_path,行,天数,lk): ...

pandas 重新索引多重索引无法正常工作

我有一个 pandas（版本 1.0.5）DataFrame，具有两个级别的 MultiIndex，例如喜欢： mi = pd.MultiIndex.from_product((('a', 'c'), (5, 12))) np.随机.种子(123) df = pd.DataFrame(data=np.random.ran...

将包含日期的列按月拆分为多列。 SQL

我正在尝试根据月份验证登录的用户。 SQL 当前df 用户 ID 日期 P1302 2023-11-01 P1302 2023-10-01 P1302 2023-09-01 P1302 ...

如何从前面的其他列中减去特定列的平均值？

我想从数据集中前 3 列的每个值中减去每个“空白”列的平均值，如下所示： df <- data.frame(da=1:5...

查找其中一列发生移动的两列之间的最大值

我的数据框是：将 pandas 导入为 pd df = pd.DataFrame( { “一”：[20,9,31,40], 'b': [1, 10, 17, 30], } ）预期输出：创建列 c ABC 0 20 1 20 1 9...

DT::DTOutput 仅在第一行放置样式

我有一个数据框df。我想知道是否可以仅在第一行添加样式，我想突出显示计算缺失值的行，并且我希望在

模块“pandas”没有属性“read_csv

将 pandas 导入为 pd df = pd.read_csv('FBI-CRIME11.csv') 打印（df.head（））运行这个简单的代码会出现错误：回溯（最近一次调用最后一次）：文件“C:/Users/Dita/Desktop/python/les...

前一天数据填写N/A

我有一个数据框，它只有工作日的数据。以下是示例数据框：将 pandas 导入为 pd df = pd.DataFrame({'BAS_DT': ['2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05', '2023-01-05 ...

在 R 中查找多列中的字符串

我有多个列，其中包含相似的数据，并且我有多个单词，我想知道它们是否在其中一列中。举个例子： df = data.frame(ttt1= c("METO",&q...

Pyspark - 按列表循环数据帧列

pyspark 新手。只是尝试简单地循环变量列表中存在的列。这是我尝试过的，但不起作用。列列表 = ['colA','colB','colC'] 对于 df 中的 col：如果 col 在

JUNIT 测试用例-Spark JDBC

我是 Java 编程的新手。我有一个从Oracle数据库读取数据的方法。现在我需要帮助使用 JUnit 框架为以下代码编写测试用例。数据集 df = Spark.read().

合并索引上的两个数据帧，去掉 key_0

我想通过索引列合并两个数据帧。我的代码是：将 pandas 导入为 pd 将 numpy 导入为 np df1 = pd.DataFrame({'a': ['红色', '红色', '红色']}) df2 = pd.DataFrame({'b': [1, 2, 2]}) df = ...

将 R 中 3 个变量的总和重新调整为恰好等于 1

我有一个如下数据框，其中有 3 列，每列代表在单个活动中花费的时间比例。 df <- data.frame(ID = c(1, 2, 3, 4), (time_1 = c(0.25...

如何系统地根据列位置对列进行操作？

有没有一种方法可以根据列的位置系统地划分列？例如，使用这样的数据框： df <- data.frame(id = ('a1', 'a2'), a = c(1, 0), b = c(4,0), c = c(4, 3...

np.select 将所有真实值连接在一起

我有一个数据框，想检查每一行我的条件是否正确。如果 multiple 为真，我想用 np.select 返回所有这些选择。我怎样才能做到这一点？ df = pd。

找到两列之间的最大值，其中其中一列被移动并更改最后一行的值

我的数据框是： df = pd.DataFrame( { “一”：[20,9,31,40], 'b': [1, 10, 17, 30], } ）预期输出：创建列 c 和名称 a b c 名字 0 20 1 20 南 1...

Pandas：df 的每一行中的值的平均值，但仅限于使用正则表达式过滤的选定列范围

鉴于我的df id 权重项目 Exp_type 研究员 events_d1 events_d2 events_d3 events_d4 events_d5 0 50 p1 急性亚历克斯 0 0 0 4 2...

这是重命名 Polars DF 列的最高效方法吗？

问题：我有一个列名，可以根据某些函数参数更改其前缀和后缀，但列名的一部分始终是相同的。我需要将该列重命名为

在 geom_boxplot 中取消对齐过度绘制的异常值

我有一个向量，其中有一些重要的异常值，总共 5 个。只有 3 个异常值是不同的。因此，相同的值会在 geom_boxplot 中过度绘制： df <- data.frame( Ratio = c(r...

如何检查数据帧列中的所有非 nan 值是否 > 0？

我有一个数据框列，可能有 NaN，这是可以接受的，但非正值是不可接受的。我尝试做断言 (df[col] > 0).all() 但这断言是否存在 nan co...

Pandas groupby.head(-n) 删除一些组

我有一个如下所示的 df：对于每个 reviewerID，我想选择最后 2 个实例（按 reviewTime 排序）作为测试数据，其余的（最多最后 2 个实例）作为训练数据集。这是我的代码...

查找同时包含数字和字符串数据类型的特定列中的最大值

我有一个 df，其中包含一列（例如“经度”），其中包含数字和字符串数据类型。例如：[5，“高”，“3”] 我想更改包含...的行

组合两个条目顺序不匹配的数据帧

我有 2 个数据帧，称为 df 和 df2 ，下面显示了两者的一个小示例。我想通过“公式”列 df2 匹配数据帧的条目，将两者连接成一个组合数据帧...

df 相关问题

最新问题