pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

将列表中的空列附加到现有数据框

考虑一下: 我有一个(相当长的)列名列表: 列 = [a, b, c, d] 我有一个 df,其中有一些列如列表中所示,还有一些新列: 将 pandas 导入为 pd 数据 = {'a': [1, 2], ...

回答 1 投票 0

我可以在pandas中设置可变的列宽吗?

我在 pandas 数据框中有几列包含长字符串的文本,但我只对检查其中一列感兴趣。有没有办法使用 pd.set_option('max_col...

回答 4 投票 0

如果csv存储为变量,如何使用pandas read_csv()方法?

我正在尝试处理谷歌电子表格中的数据,将其读入csv,然后使用pandas.read_csv()将其作为数据框使用。 我可以将 csv 读出到一个变量中(变量...

回答 2 投票 0

Pandas 从 url 读取_csv

我正在尝试使用 Python 3.x 从给定的 URL 读取 csv 文件: 将 pandas 导入为 pd 导入请求 url =“https://github.com/cs109/2014_data/blob/master/countries.csv” s = requests.get(...

回答 6 投票 0

将多个数据集合并到一个数据框中,保留一列作为 pandas 中的主索引

我有一些导出和计算的数据集,如下所示 Df= ID。分数。年级 123.45.A 456.60.AA 789.35.B 345.90.O Ds= ID。团队。平均得分 123.巨人...

回答 1 投票 0

熊猫分组和变形

我有一个由以下方式生成的数据框: df = pd.DataFrame({'日期' : [*['2020-01-01']*3, *['2020-01-02']*3, *['2020-01-03']*3 ], 'id' : ['A1', 'A2', 'A3']*3, ...

回答 1 投票 0

通过单击带有硒的按钮来抓取文本

我想用selenium抓取一些文本数据,我自己抓取页面没有问题,但我需要单击一个按钮来提取完整的文章,我只有来自mai的标题...

回答 1 投票 0

如何有效地加快 Pandas 中我心爱代码的循环速度?

我一直在考虑使用多处理、cyton 和 numba 来加速我的代码的以下部分,但我就是无法弄清楚。我目前的结论是我的代码是无效的,尽管它

回答 1 投票 0

在数据框中一起Apply()和get()

我有一列名称(“名称”),其中也可能包含 2 个版本的也称为(又名),例如“约翰·斯诺别名伊耿·坦格利安”和“提利昂·兰尼斯特@小鬼”。 ...

回答 1 投票 0

为什么带有 dropna=False 的 groupby 会阻止后续的 MultiIndex.dropna() 工作?

我的理解是MultiIndex.dropna()删除至少一级为NaN的索引条目,没有条件。然而,如果之前的 groupby 与 dropna=False 一起使用,则似乎不是

回答 1 投票 0

使用 numpy 和 pandas 绘制小刻度

如何向使用 numpy 完成的绘图添加小刻度? 我有一个包含两列 A 和 B 的文件,我需要使用 numpy 将每一列乘以不同的因子,并且我想绘制它们(有 s...

回答 1 投票 0

Pandas 数据框 - 是什么原因导致此错误?

我的代码: 框架 = pd.DataFrame({'a': np.random.randn(100)}) 商店 = pd.HDFStore('mydata.h5') 商店['obj1'] = 框架 商店['obj1_col'] =框架['a'] store.put('obj2',frame,foramt='表') 商店.选择(...

回答 2 投票 0

如何将变量从 CSV 文件传递到 Python 中的 Oracle SQL 查询获取?

我有以下代码段,我在其中读取 csv 文件并连接到数据库。然后我想将 CSV 文件中的两列作为变量传递给我的查询,并最终将结果转换为 pd

回答 1 投票 0

如何使用nans对pandas列进行zscore标准化?

我有一个 pandas 数据框,其中有一列我想要 zscore 标准化的实际值: >> 一个 数组([ 南, 0.0767, 0.4383, 0.7866, 0.8091, 0.1954, 0.6307, 0.6599、0.1065、0...

回答 5 投票 0

使用any(1)的pandas突然开始出错?

我的代码工作完美,当我尝试时,我现在更新了 openpyxl: data = {'Col1': ['费用', '已实现损益', '其他贷方和借方', '其他一些值'], 'Col2': [100, 200, 300, 40...

回答 2 投票 0

Python Pandas 复制数据框中的行

如果数据框看起来像: 商店、部门、日期、Weekly_Sales、IsHoliday 1,1,2010-02-05,24924.5,假 1,1,2010-02-12,46039.49,正确 1,1,2010-02-19,41595.55,假 1,1,2010-02-26,19403.54,假 1,1,2010-03...

回答 7 投票 0

Pandas 系列的累积产品重采样

我正在将数据汇总到每日数据箱中。我的数据每天都有重复的数据点,但同一秒的数据点不同。 由于非唯一索引,朴素重采样和前向填充失败: 频率=“D”

回答 1 投票 0

将类 str 表传递给数据框

tabela_site = driver.find_elements(By.CLASS_NAME,"table") 塔贝拉 = tabela_site[0].text Como passar esse resultado que é a tabela para um dataframe ? df = pd.read_html(塔贝拉) df Da o seg...

回答 1 投票 0

Python - 枢轴/分组 - pandas 长到宽

我有多个表,它们都具有相同的列。文档包含具有 3 个不同 ID ID1、ID2 和 ID3 的项目。 ID 大多是不同的 accros 表,但有一些重复,并且......

回答 1 投票 0

在 Jupyter Notebook 中运行 pandas.read_csv() 时获取“运行错误索引:1,大小:1”

在 IntelliJ 中使用 Jupyter Notebook 和 Python 3.11 将 pandas 导入为 pd df = pd.read_csv('customers-100.csv') 尝试使用不同的 csv 文件和其他参数,例如: df = pd.read_csv('

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.