pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

熊猫滚动最接近的值

假设我们有以下数据框: 时间戳 开盘价 开盘价 最低价 收盘价 Delta atr last_index 看跌 看涨转折点 2 04-10-2024 01:54:44 18370.00 18...

回答 1 投票 0

DPY-3002:不支持“int64”类型的Python值;显然我需要将我的代码与 InputHandler 结合起来,但我在结合它们时遇到了困难

我有下面的代码,我使用 cx_oracle 从数据库中提取并从 csv 文件传递变量。变量“unitid”的数据类型确实是 int64,但我尝试了多次转换但没有成功。

回答 1 投票 0

如何计算列中的重复条目?

我有一个像这样的数据框: 价值 0 0 0 1 1 0 0 我想创建另一列,以便它计算一个值在批次中重复的次数: 价值 频率 0 3 0 3 0 3 1 2 ...

回答 1 投票 0

如何计算非 pandas 列的重复条目?

我有一个包含列的数据框 价值 0 0 0 1 1 0 0 我想创建另一列,以便它计算一个值在批次中重复的次数 价值 频率 0 3 0 3 0 3 1 2 1...

回答 1 投票 0

使用 SQL 查找发票数据中 18 个月的差距

我需要有关此 SQL 查询的帮助。我有这张表,其中包含自 2020 年 7 月 1 日以来的每张发票。该表中有 CustomerID 和 InvoiceDt。对于每个 CustomerID,我需要知道是否有 18 个月...

回答 1 投票 0

计算 Pandas GroupBy 上的任意百分位数

目前 Pandas 的 GroupBy 对象有一个中值方法。 有没有办法计算任意百分位数(请参阅:http://docs.scipy.org/doc/numpy-dev/reference/ generated/numpy.perce...

回答 4 投票 0

X 轴刻度值与数据不匹配

我是plotly的新用户。我的绘图的 x 轴(标签/刻度)值与为 x 轴指定的数据不匹配。 将 pandas 导入为 pd 将 psycopg2 导入为 odb 将plotly.express导入为px 来自 urllib.parse

回答 1 投票 0

根据另一列中的 nan 重置值后重新调整 Pandas 列的权重

这里是PyNoob。给定数据框,例如: df = pd.DataFrame({'类型': ['A', np.nan, 'B', 'C', 'D', np.nan], 'wgt': [0.1, 0.2, 0.3, 0.25, 0.1, 0.05]}) 我想将 Type = nan 设置为 wgts = 0,并且

回答 1 投票 0

在 pandas/dask 中有效过滤逗号分隔的字符串

我有一些具有以下形状的数据(带标题) 名称、信号、日期 我的名字,1,2,3,4,5,6,7,8,9,10,19-04-2024 我的名字,1,2,3,4,5,6,7,8,9,10,19-04-2024 我对过滤行感兴趣...

回答 1 投票 0

Pandas - 在分组数据框中添加具有不同值的行

我想为每个组添加行。在每个新行中,必须根据每个组特定的时间间隔更新日期。示例:n_times:相应组的行数,interval_days:距离...的天数

回答 2 投票 0

比较 2 个 pd.array 的结果令人惊讶

使用 python 3.10.13、pandas 2.2.0 和 numpy 1.26.4,我希望能够使用类似的东西(按照 ruff linter 的要求): # 这是错误的 $ (pd.array([""]) == pd.array(["&...

回答 1 投票 0

比较 2 个 pd.array 的令人惊讶的结果

使用 python 3.10.13、pandas 2.2.0 和 numpy 1.26.4,我希望能够使用类似的东西(按照 ruff linter 的要求): # 这是错误的 $ (pd.array([""]) == pd.array(["&...

回答 1 投票 0

Pandas 外部合并

我有两个数据框 数据框1 列 1 列 2 1A 1乙 2℃ 5Z 数据框2 列 1 列 2 1A 1B 2E 3X 我正在执行外部合并 合并= pd。

回答 1 投票 0

如何选择 pandas 数据框中的行百分比

在 python 中,我有一些结构如下的数据帧: 0 0 0 0 1 1 1 1 2 2 2 2 。 。 。 。 恩恩恩恩 如何选择中间 33% 的行(由索引决定,而不是值)? 这是我尝试的: df...

回答 5 投票 0

以 5 分钟为间隔对 DataFrame 进行分组

如何使用 Python/pandas 从此 csv 中获取 5 分钟数据? 对于每 5 分钟的间隔,我尝试获取该 5 分钟间隔的日期、时间、开盘价、最高价、最低价、收盘价、成交量。 达特...

回答 4 投票 0

探索数据集中混合值类型拆分的有效方法

早安社区, 我有许多现有的数据集遵循这种格式的变体: 姓名 时间 速度1 速度2 速度3 激光 21:29:30 F350 F350 F350 派瑞克斯 21:35:40 F350 F350 F350 漫画0710...

回答 1 投票 0

Pandas df.to_excel 太慢了,有什么办法可以加快速度吗?

我正在处理一组几乎有 60 列的数据(文本/地址/数字)。使用 Pandas 处理数据后,我必须将其导出为 xlsx 格式。 这就是我生成输出的方式:...

回答 3 投票 0

如何检查并查找 pandas 数据框中的列中的空值并创建 CSV 日志文件并将空值详细信息写入日志文件中?

嗨,我有一个数据框,如下所示 代码区域角色类型 23.AA。经过 34.BB。 C.X 南。抄送。 A.Z 56. BB。 C.Y 67. 45.C.Y. 我需要检查...

回答 1 投票 0

根据同一数据帧中的查找将值添加到数据帧

我尝试着想出一个解决方案,用于在 pandas 数据框中查找和填充附加列以提高可读性。 当manager_id被填充时,可以得到以下数据(截断)...

回答 1 投票 0

计算数据框中持续的连胜

我有一组体育比赛的数据,其形式如下: 获胜者 = ['A', 'A', 'B', 'C', 'A', 'C', 'C', 'B'] 失败者 = ['B', 'C', 'A', 'A', 'B', 'A', 'B', 'C'] P1 = ['A', 'A', 'A', 'A'...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.