pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何以实现下述所需行为的方式添加两个 pandas 数据框

生成的数据帧将对匹配索引的值进行求和,但是如果一个索引在一个数据帧中丢失但在另一个数据帧中存在,它只会将它们保留下来而不是删除它们。 例如...

回答 1 投票 0

Pandas - 过滤器 - 类型错误:'in <string>' 需要字符串作为左操作数,而不是列表

我正在探索 Pandas 过滤器,在这样做时我在使用下面的查询时遇到了这个错误 df2.filter(如 = ['共和国','联合'] , axis =0 ) 如何在

回答 1 投票 0

使用Python从Excel单元格中提取值

输出 输入 我想从黄色和灰色单元格中提取文本。我还想返回单元格引用,以便我可以返回“LE 2024 Curr vs Prev”以及 $ 和 % 下的值。我尝试跑步...

回答 1 投票 0

尝试使用 python pandas 删除列中没有数值的所有行

年龄 0 55 1 45 2 58 4 不适用 我需要删除给定数据帧示例上方列年龄中不包含数值的所有行 预期输出如下 ...

回答 4 投票 0

转换文件,以“|”分隔到 Python 中的数据框

我有一个TXT文件,有近200万条记录,这些记录都是用“|”分隔的值没有标题,所以它们看起来像这样: 340658221|1540.0|1500.0|40.0|2023-10-23|帕加多| 342103146|650.5|64...

回答 1 投票 0

按日期和组增量计算总价值

这是我的数据框。 有一个日期索引,每个日期有 4 个符号。 我想循环每个符号的每个日期。 “数量”列是根据

回答 1 投票 0

Pandas - 循环重复的日期索引

这是我的数据框。 有一个日期索引,每个日期有 4 个符号。 我想循环每个符号的每个日期。 “数量”列是根据

回答 1 投票 0

处理数据框而不将其加载到内存中

我有一个略多于 50 万行的数据框。这些列保存的值非常小,因此数据帧很容易存储在内存中。 然而另一方面,我有大约 700GB 的数据...

回答 1 投票 0

有序 Logit 回归的预测是如何工作的?

我正在学习有序 logit 回归,我想知道预测在数学上是如何工作的以及我如何自己在 python 中完成它。我知道在 python 中我可以简单地使用预测...

回答 1 投票 0

Python pandas 数据框使用 apply 来调用具有列表输出的函数

我正在尝试将函数应用于 pandas 数据框列的每个元素。该函数应该返回一个字符串列表。我希望列表中的每个字符串都成为自己的列...

回答 1 投票 0

如何避免 Pandas 丢失 1 位 datetime2 精度?

我正在使用 read_sql_query 函数将一些 SQL Server 数据读入 Pandas 中。问题是我在 DATETIME2 列上丢失了一位精度。 编码示例: 查询 = pd.read_sql_query( ''...

回答 1 投票 0

Spark 熔化/将列转置为值

我正在尝试将表的列转置为行 我有一个看起来像这样的表: +-----+-----+-----+-----+ |日期 |col_1|col_2|col_...| +----------------+--------------------+ | 1 | 0.0| 0.6| ...

回答 1 投票 0

给定列特定名称时如何解决(NaN 错误)

我有很多文本文件,其中包含以下数据: 350.0 2.1021 0.0000 1.4769 0.0000 357.0 2.0970 0.0000 1.4758 0.0000 364.0 2.0920 0.0000 1.4747 0.0000 371.0 2.0874 ...

回答 1 投票 0

如何在Python Pandas中读取csv以将值划分为几列? [重复]

我有 csv 表格,如下所示: 日期 第 1 列 1 2020年4月1日 111 2 2019年11月5日 2 3 2018年5月22日 86 但是当我尝试使用以下代码在 Python Pandas 中读取 abowe csv 时: df= pd.read_csv("my_data.csv&...

回答 2 投票 0

使用正则表达式从字符串(不同格式)中提取 int 值

我的 Pandas 数据集中有一个字符串值(足球得分)。我想从这个比分中提取主场进球和客场进球。 分数可以用几种方式写(有时是......

回答 1 投票 0

如何使用函数正确索引数据框?

给定一个数据框: ABC u 5 0 3 v 3 7 9 宽 3 5 2 我想使用函数选择数据框中的行/列。该函数获取数据帧并返回实验室列表的元组...

回答 1 投票 0

合并两个数据帧(其中一个数据帧具有重叠范围)的最佳方法是什么?

我的数据框是: 将 padnas 导入为 pd df_1 = pd.DataFrame( { 'a': [10, 12, 14, 20, 25, 30, 42, 50, 80] } ) df_2 = pd.DataFrame( { “开始”:[9, 19], “结束”:[26...

回答 1 投票 0

使用 JSON 完成数据帧

我有一个像这样的JSON: 人={ '乔恩':{'年龄':20 }, “彼得”:{“年龄”:30 } } 我有一个按名称索引的数据框: 城市 年龄 乔恩 富 南 彼得 富 南 最好的方法是什么

回答 1 投票 0

通过固定 Beta 计算 R 平方,实现无截距的多重线性回归

我想根据我拥有的一些数据修复多重线性回归中的贝塔值,这会导致基于Tibshi中提到的投影方法,R方值小于0%且大于100%...

回答 1 投票 0

Python:MultiIndex Dataframe 到类似 json 的字典列表

我想存储这个数据框 df = pd.DataFrame({ 'id':[1,1,2,2], '性别':["m","m","f","f"], 'val1':[1,2,5,6], ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.