pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

对多索引数据帧进行排序时如何使用两个关键函数?

在 MultiIndex 数据帧上对 df.sort_index() 的调用中,如何将 func_2 用于第二级? func_1 = lambda s: s.str.lower() func_2 = lambda x: np.abs(x) m_sorted = df_multi.sort_index(level=['one'...

回答 1 投票 0

如何在pandas中用partition by模拟windows功能?

我在original_eur列中得到了带有空值的数据。 事件ID 类别 round_bot_date 原始欧元 0 43ee085d-40b4-44f7-bdf5-c9e649284527 第 1 类 2024-03-25 00:00:00 200 1 bd9a68b1-c62d-4481-a...

回答 1 投票 0

根据行条件计算(pandas)

我遇到了以下问题:我有一个看起来像这样的pandas数据框。 | id_tranc | id_tranc |总和|出价 | |:------- |----:|:----------:|--------:| | 1|4000|2.3%| | 1|20000|3...

回答 1 投票 0

如何对 DataFrame 中的值进行排序

我有一些疑问。我得到一些结果 poz = 正数[正数["数字"]>0].head(10) 波兹 我得到了输出: 数字 异常16 废除5 可恶5 可憎4 中止 1 中止...

回答 1 投票 0

如何在网页抓取时将 colspan 包含到表头

我是网络抓取新手,我正在尝试从该网站抓取 2022 年福布斯排行榜 - https://en.wikipedia.org/wiki/List_of_largest_companies_in_India , 但排名栏和福布斯排名...

回答 1 投票 0

如何在网页抓取时将 colspan 包含到表头中

我是网络抓取的新手,我正在尝试从该网站抓取 2022 年福布斯排行榜 - https://en.wikipedia.org/wiki/List_of_largest_companies_in_India , 但排名栏和福布斯排名

回答 1 投票 0

Pandas 数据框:根据情况替换值

有一列数据框 性格 --------- 没有答案 已回答 失败的 忙碌的 错误 警告 取消 如何根据条件替换值: 当处置 =“无应答”时,则 0 W...

回答 1 投票 0

如何根据列的上升条纹创建组?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': [10, 14, 20, 10, 12, 5, 3] } ) 这是预期的输出。我想创建三个组: A 0 10 1 14...

回答 1 投票 0

在单次扫描中创建列表

我想根据另一列中的条件从一列创建 2 个列表。目前,我可以通过扫描数据帧两次来获取两个列表。 是否可以通过一次扫描获得 2 个列表? 格...

回答 1 投票 0

如何仅将Dataframe Mapper转换为PMML

我想使用多个PMMLS来将数据转换和模型应用分开。以下是我正在使用的代码。我这样做是因为我想包括某种

回答 1 投票 0

.cdf 文件的频谱图

我有一个 .cdf 文件,其中包含变量 Epoch、FEDU 和 L。我想绘制一个在 x 轴上具有 Epoch(代表时间)并变化 L 和 FEDU 的频谱图。我使用的数据位于文本处。阿尔...

回答 1 投票 0

Python bug 导入数据框的 csv 文件

将 pandas 导入为 pd # 读取指定编码的CSV文件 df = pd.read_csv("Moodle/perguntas_1.csv", 编码 = 'utf-8') # 显示数据框 打印(df) 它不导入...

回答 1 投票 0

交换联系人导入的条件串联

*CSV 包含虚假信息 Kaggle 上的 Python 和 Pandas + Numpy 语境: 目标是导入/更新 Exchange 联系人。用户希望搜索学生的家长电子邮件。 输入(参见 CSV 屏幕...

回答 1 投票 0

无法在 DataFrame where 子句中将大小为 4 的数组重塑为 (4,4) 形状

谁能给我解释一下发生了什么事吗?这是一段代码。如果我的 DataFrame 的长度恰好为 4,则 try 子句中的语句将引发异常。如果我制作任何

回答 1 投票 0

模块“numpy”没有属性“ndarray”

我的Jupiter笔记本被压坏了,所以我必须重新安装笔记本,但是在新的Jupiter笔记本中,我无法运行pandas。 将 pandas 导入为 pd 属性错误回溯...

回答 4 投票 0

几个excel文件后算法变得很慢

问题概述 我需要将多个 .xlsx 文件合并到工作表中,其中每个工作表名称必须是文件名。 当前的问题 下面的代码在几次之后变得很慢并且消耗大量内存......

回答 1 投票 0

如何使用Pandas将R的Tukey的HSD表转换为Python中的相关矩阵

我最近从 R 的 TukeyHSD 测试中导出了一个表格,以获得各个时间组(0、5、10、20、30、40、50、60)的 p 值。我很好奇是否有一种方法可以将其转换为corre...

回答 2 投票 0

Pandas:根据目标分布从 DataFrame 中采样

我有一个 Pandas DataFrame,其中包含从分布 x 中提取的实例的数据集 D。例如,x 可以是均匀分布或高斯分布。 我想根据一些新的

回答 1 投票 0

有没有办法在气流中并行化我的 pandas 数据框函数?

我目前正在开展一个需要使用气流的学术项目。目前,我只处理一个数据库表,因此我需要一些帮助来知道我是否要进入 c...

回答 1 投票 0

将数据宽转换为长,压缩为 1 分钟间隔

寻找Python帮助将数据从宽数据转换为长数据(?) 我的数据看起来像这样: 通道 ID,utc,scet,val1,val2 A-0001,2024-061T22:00:05.02064,0.03,3, A-0002,2024-061T22:00:06.020...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.