dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

按A列中的值进行子集化,得到R中B列最大值行对应的C列中的值?使用循环自动执行此操作

标题相当令人困惑(抱歉),但我会尝试在这里解释一下。 我有一个数据集,其中包含多个人的姓名、他们在一周中的某一天喝过的咖啡数量以及...

回答 1 投票 0

Pandas 中 2 列匹配,但另一列不匹配

我一直在尝试使用 pandas 解决一个问题,但它已经困扰了我几天。我有 2 个数据框: 数据 = {'GMC1':[1, 3, 5, 5, 8, 9, 8, 13], “提供商1”:[101,...

回答 3 投票 0

尝试在简单的 shift() 操作中传递列表达式时,出现极坐标数据帧的计算错误

抱歉,我要从 Polars 开始。有没有办法实现与 shift(n) 函数相同的功能,其中 n 是数据帧变量。 当我尝试时: df = pl.DataFrame({ “一”:[1,...

回答 1 投票 0

如果满足条件,Pandas 会从列中删除第一个字符

我有一个包含电话号码分机号的系列(格式为x1234)。但是我们的系统有 5 个字符的限制。 如果字符串长度为 6,如何删除 x(第一个字符)? 我在这里...

回答 1 投票 0

Pyspark Azure Synapse - kryoserializer 缓冲区溢出

我在使用 Azure Synapse Notebook 时遇到问题。我有一个大的 python 脚本,其中使用 Pandas Dataframe,我可以加载“parquet”文件,但我无法使用 toPandas() 转换为 pandas,

回答 1 投票 0

提取电话分机号码(如果存在)

我正在尝试清理一些数据。我有两个字段,称为电话和分机。电话的值为空或格式为: (800) 555-9876 (800) 555-1234 x__________ (800) 555-1234 x0123____...

回答 1 投票 0

如何找到两个 dfs 之间的区域重叠

我有一个 df 具有字符和位置,另一个具有字符、开始、结束。我想找到 df1 中与 chr 匹配并与 df0 位置重叠的所有区域。请参阅示例...

回答 1 投票 0

Python 数据类型

我正在访问 HousePrices.csv 数据集。分配数据帧后,我正在尝试优化内存,为此我正在更改数据类型。 令我惊讶的是,我能够更改日期对象......

回答 1 投票 0

合并两个数据帧后,如何重新分配行索引?

我合并了两个数据帧,但我想对索引重新排序,以便它的行号依次增大 1。因此,例如下面的示例,3162 应该是 281,依此类推... 278 2024-05-08 09:18:40.22446905...

回答 1 投票 0

.transform('first') 是做什么的?

有人帮我要了代码。我理解代码中的所有内容,除了最后一行 .transform('first') 我看到它做了什么(我可以看到它),但我想准确地知道它在做什么...

回答 2 投票 0

在 Altair 中重新排序堆叠条形图

所以我正在制作一个交互式绘图(这就是我使用 Altair 的原因),并且我想重新排序每个条形中的堆栈以匹配图例。我尝试过重新排序 df,我尝试过使用“排序”参数...

回答 1 投票 0

Pandas:根据条件合并数据帧但保留 NaN

我有两个数据帧,df1 和 df2,我想将它们合并到列“id”上,其中 df1 中的“触发日期”位于 df2 的“开始日期”和“结束日期”之间,但是,将行保留在...

回答 1 投票 0

当动态发现要聚合的列时,如何获取数据框的分组和聚合值?

我有一个数据框,其中有一个键列、一些值列和一些时间戳列。对于某些键,可能有多行在值和时间戳列中具有不同的值。 我想...

回答 1 投票 0

我的流式代码出现问题 > SnowparkPandasException: (1114): Cannot write pandas DataFrame to table

我需要创建一个表单来对供应商进行从 1 到 10 的评分,添加自由文本评论并保存 结果到我命名为“RESULTAT_SUPPLIERS”的表中。然而这张桌子不是同一个Sc...

回答 1 投票 0

将空格分隔列表转换为逗号分隔列表

我有pandas数据框,其中行是[“a”“b”]。如何将其转换为逗号分隔列表,如 [“a”, “b”]? 我期望返回包含两个逗号分隔元素的列表

回答 1 投票 0

合并数据框中具有相同列值的行的有效方法?

我有一个数据集,其中包含我想要合并的重复项;它看起来像这样: 名称 类型 利润 成本 年份 1 斧 10 5 2012 2 B X 20 ...

回答 1 投票 0

Pandas:根据条件和前一行值创建列值

我想在 Pandas 数据框“df”中创建一个列(在给定的示例中为“amount”),其中每行的值基于其之前的行以及另一列“i..”的值。 .

回答 3 投票 0

pyspark - 使用 OR 条件连接

如果至少满足两个条件之一,我想加入两个 pyspark 数据帧。 玩具数据: df1 = Spark.createDataFrame([ (10, 1, 666), (20, 2, 777), (30, 1, 888), (40, 3,...

回答 2 投票 0

如何获取2个不同ID每3分钟的数据总和?

假设我有一个像这样的DataFrame: ID-A ID-B 时间 一 2022-02-14 00:01:07 2022-02-14 00:02:06 2022-02-14 00:02:55 阿2 2022-02-14 00:00:07 ...

回答 1 投票 0

Pandas 使用 value_counts 函数对多列进行分组

我想将 value_counts() 应用于多个列并进一步重用相同的数据框以添加更多列。我有以下数据框作为示例。 id 商店类型 状态 0 1 马克...

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.