dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

如何在不使用for循环的情况下更新多个字典键值

我有一个具有相同键但不同值的字典列表。 例子: [{ '价格' : 100, '数量' : 3 }, { '价格' : 200, '数量' : 5 }] 有没有办法更新零件的值...

回答 2 投票 0

排查函数“数字表达式有 6 个元素:仅使用第一个元素”中的错误

我有以下示例数据 示例_数据 <- data.frame( ID = 1:6, Month.Of.birth = c("September", "April", "December", "June", "April", &q...

回答 1 投票 0

争论熊猫数据框

我有一个大数据框,如下所示。 期间值 1 30 1 40 1 50 2 60 2 75 2 80 3 90 3 100 3 200 我想要...

回答 1 投票 0

如何在 SQL 中添加具有另一列中某些值累积的列?

我有一张桌子: 日期 ID 操作值 2021-09-02 AA收入500强 2021-09-02 AA消费500 2021-09-02 AA 支出 45 2021-09-03 aa

回答 2 投票 0

构建多个箱线图,在 x 轴上使用不同的字符串名称,在 y 轴上使用不同的值

所以我想构建一个箱线图(最好使用seaborn,但你可以使用任何库),x 上有“county_name”,y 上有“deaths”,这是数据框: 死亡病例 国家的名字 奥地利...

回答 1 投票 0

使用 condformat 包格式化数据帧

我正在尝试使用 condformat 包有条件地为 df 中的三列着色。我已经成功完成了一个(百分比),但无法理解为什么其他(AnswerA 和 AnswerB)不起作用...

回答 1 投票 0

如何使用 pyspark 根据间隙总和插入缺失值?

我有一个包含四个字段的时间序列数据集,例如:user_id、timestamp、miles 和total_mileage。英里是在一个时间步长内行驶的英里数,total_mileage 是汽车的里程......

回答 1 投票 0

如何使用 R 中的 dplyr 函数将仅因子列的 Likert 量表从长转换为宽?

我在 R 中有以下数据框,具有 3 个因子列,具有相同的级别,如下所示: A 乙 C 1 1-强烈不同意 5-强烈同意 1-强烈不同意 2 3 一般般 5-强烈同意 2-不同意 ...

回答 1 投票 0

读取 Excel 文件中的表格

我目前正在尝试读取包含多个表格的Excel文件,但表格没有保存为表格,它们就像信息一样保存,但分为表格(不知道这是否有意义)...

回答 1 投票 0

当使用when()表达式时,如何在Python极坐标中停止otherwise()?

这是我的数据框: ┌──────────────────────┬──────────┐ │ 日期 ┆ 价格 │ │ --- ┆ --- │ │ 日期时间[μs] ┆ f64 │ ╞═════════════════════╪══════════╡ ...

回答 1 投票 0

两个 pandas 数据帧元素的平均值连接到元素结果...为什么?

我有两个数据框: 打印(d1.head()) 代码 Prof Amp 477 0.7 3.0 0.724997 478 0.7 3.0 0.736914 479 0.7 3.0 0.612189 480 0.7 ...

回答 2 投票 0

将类的属性输入到 Pandas 数据框中

我有一个名为 Entry 的类,它具有这些属性; 列、任务、描述、分配的成员、时间线 每个属性存储一个字符串。 我想在

回答 1 投票 0

检查字符串中数字的连续性

我有一个字符串列出了个人的任期,例如: 所有术语 <- "2012 to 2024, 2007 to 2007, 2001 to 2003, 2000 to 2009, 2010 to 2011" I want to know whether the indi...

回答 1 投票 0

在Python中减去日期类型数据的列

我有下一个例子 将 pandas 导入为 pd 数据 = { 'id_number': ['000001000', '000009795', '000011722'], 'first_date': ['2022-01-08 13:41:00', '2022-11-07 09:16:00', '2022-02-15 12:4...

回答 1 投票 0

Python 函数变量名而不是值

我有一个数据框。如果满足某些条件,我需要创建一个新列。我在变量中创建了逻辑。 例子: 逻辑1 = ''' 单位销售额 > 1000 且总销售额 >= 1000000 ''' 逻辑...

回答 1 投票 0

合并两个数据帧但基于字符串匹配条件

在Python中,我有两个数据框。 df1 如下所示: ID 限制 评论 12 200 ['正常'] 23 202 [“紧急”] 23 203 ['正常'] 43 304 ...

回答 1 投票 0

Pyspark - 重复值直到列发生变化

我有一个具有这种结构的数据框 订单号 电话号码 物品 类型 12345 1 1001 家长 12345 2 1002 孩子 12345 3 1003 孩子 12345 4 1004 孩子 12345 5 1005 家长 12345 6 1006 孩子 我

回答 1 投票 0

如何从 pyspark 数据框中删除所有重复项

在此 Pyspark Dataframe 中,有一些记录在 ID 字段上有重复。 ID 开始时间 1 2020-02-09 1 2021-02-15 2 2022-05-04 3 2023-05-15 我想删除所有记录...

回答 1 投票 0

在带有缺失值的Python数据帧上解码base64

我有一个带有 val_string 列的数据帧,有时会填充 Base64 编码的字符串,有时会填充 NaN。 df 基本类型 val_int val_string 0 整数 34 ...

回答 1 投票 0

Pandas - 合并 DataFrame,在公共列上保留非空值,在另一列上保持平均值

我正在使用两个 DataFrame,定义如下: 将 pandas 导入为 pd df1 = pd.DataFrame([[1, 'a', 0.95], [2, 'b', 0.92], [3, 'c', 0.91]], columns=['id','值','相似']) df2 = pd.DataFrame...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.