dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用 Polars .filter 进行切片比 pandas .loc 慢

我正在尝试将一些 Pandas 代码切换为 Polars 以利用它的性能。我发现 .filter 操作比使用 .loc 的类似切片慢得多。 将 pandas 导入为 pd 我...

回答 1 投票 0

使用正则表达式将所有带单引号的字符串转换为另一个文字的 Pandas 代码不起作用

我正在尝试将每行包含多个单引号字符串的 csv 更新为将这些字符串替换为文字的字符串。但它将所有数据放在输出的第一行。有人可以建议吗...

回答 1 投票 0

对数据进行分组并删除重复的

我有下表形式的数据 名称 马斯塞 中号 ((87) 83 (91) (97)) 特 (77) 76 罗 (60) 32 G (95) ...

回答 1 投票 0

Python panda 分组数据并删除重复

我有下表形式的数据 名称 马斯塞 中号 ((87) 83 (91) (97)) 特 (77) 76 罗 (60) 32 G (...

回答 1 投票 0

如何仅合并 r 中等于不同列中特定值的行的数据帧

我在 R 中有 2 个数据帧。 数据框 1 (df_1) 包含许多列,但这里只有 3 列相关: 问题|服务时间|估算问题 ---------------------------------------------------------- 一个...

回答 1 投票 0

使用googletrans翻译Pandas df,AttributeError错误

我正在尝试翻译 Pandas 数据框列中的单词并在 googletrans.Translator() 类中出现错误。对于单个单词或短语它可以正常工作。会不会是环境问题? 任何帮助或

回答 2 投票 0

将多个 CSV 文件合并到一个数据帧中

我正在尝试从一个 df 中的文件夹连接 csv 文件(具有相同的标题),但在读取文件时得到一个空列表: 从 pathlib 导入路径 路径='//用户//目录//' 文件=帕特...

回答 1 投票 0

我的 df 在 pandas 中的对角线平均计算

数据 = { ‘SP’: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17], '状态': ['厘米', '厘米', '厘米', '厘米', '厘米', '厘米', '厘米', '厘米', '厘米', '厘米', '厘米', '厘米'、'厘米'、'厘米'、'厘米'、'厘米'、'厘米'...

回答 3 投票 0

Python Pandas 迭代每一行执行命令并根据某些条件循环到下一行

嗨,我想在相应项目的列中运行运行脚本并进行设置,然后移动到下一行并执行相同的操作。 我有单独的 python 脚本来将邮件发送到 MAIL_LIST [数据框]https://i.sstatic...

回答 1 投票 0

如何在PySpark中获取数组类型列的L2范数?

我有一个 PySpark 数据框。 df1 = Spark.createDataFrame([ (“u1”,[0,1,2]), (“u1”,[1,2,3]), (“u2”,[2,3,4]), ], ['user_id', '功能']) 公关...

回答 2 投票 0

如何在 R 中对多列应用改进的曼肯德尔测试?

我想使用 Rstudio 在一次运行中对多列应用修改后的曼肯德尔测试,并将每列的结果(即 p 值、tau、sen 斜率等)保存在单独的数据框/csv 中。该...

回答 1 投票 0

检查列中的字符串值并在数据集 pandas 之间进行相应输入

我已经连接了数据框 滚动标记等级部分团队。 123 56.公平。 A、泰坦 > 789 70. 好。 A.国王 > 445 89. 好。 C、巨人队 > 675 ...

回答 1 投票 0

当数据集中有零时填写 NA

假设您有以下数据框: df <- data.frame(year=c(rep(2010,12),rep(2011,12),rep(2012,12)), country=c(rep("DEU",4),rep("ITA",4),rep("USA&q...

回答 1 投票 0

需要帮助来统计数字,对不同的合约进行匹配并解决小数问题

我正在尝试使用Python来帮助我将销售和采购合同与实际的货物收集和交付相匹配。标准普尔合约的规模与实际不同...

回答 1 投票 0

Pandas:按频率分箱列,具有独特的分箱间隔

假设我们有这个 DataFrame: df = pd.DataFrame(列=["值"], 数据=[0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 3, 5, 7, 10 ]) 我想根据值将它们分成 5 个容器

回答 1 投票 0

多个数据集pandas之间搜索字符串及返回值等操作

例如我有4个数据框 DM= 滚动标记等级部分 > 123 56. 公平。 A > 789 70. 好。 A > 445 89. 好。 C > 675 45. 公平 b 分贝= 团队。斯波...

回答 1 投票 0

创建一个新的 df 列并根据另一列中的子字符串有条件地分配值

熊猫初学者,如果这看起来微不足道,请道歉。 尝试在数据框中创建一个新列,其中每行的值取决于某个子字符串是否出现在前一列中,s...

回答 1 投票 0

df.replace() 无法替换数据框中的 nan 字符串

数据从txt文件中读取信息,其中包含一些nan值。我尝试使用 data.replace('nan', 0) 将所有 nan 替换为零。但找不到该系列中的 nan 值。 文件...

回答 3 投票 0

合并 Pandas 数据框和 SQL 表值

我有数据框,想要更新它或根据 SQL 表的某些输入创建一个新的数据框。数据帧 A 有两列(ID 和Added_Date)。 另一方面,SQL 表...

回答 1 投票 0

将值分组到单列而不是多列中

我有包含组变量的多列数据集。我想将值分组到单列中 我有这样的数据集 VAR1 VAR2 分数 男性 LOC1 20 男性 LOC2 30 男性 LOC3 40 女性 LOC4 50 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.