pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

将字典写入Excel

我正在尝试将Python字典转换为Excel文件。但我没有设法按照我想要的 Excel 文件的方式格式化数据框。 我有一个如下形状的字典:

回答 1 投票 0

熊猫按照特殊规则保留每第 n 行

例如,我想保留每第三行,但我必须保留可被 3 整除的数字(或类似的特殊规则)。当我看到一个可以被 3 整除的数字时,就会重新开始计数,这意味着我要开始

回答 1 投票 0

pandas:合并(连接)多列上的两个数据框

我正在尝试使用两列连接两个 pandas 数据框: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') 但出现以下错误:

回答 6 投票 0

根据条件使用其他列中的值在数据框中创建新列

假设我有一个如下所示的数据框(df)(点表示更多列): 类型 价格1 价格2 价格3 价格4 价格5 ... ... 阿楠1楠楠2 一个...

回答 2 投票 0

如何在 Pandas 中按标题对数据进行分组

如何通过 sl 列中的标题将此数据与 pandas 分组。不 我有如下 CSV 或 Excel 格式的数据。 sl.不 v1 v2 v3 标题1 1 243 45 3244 2 3 25 33 3 43 第324章 54 头2 1 3 45 54 2 24 4...

回答 1 投票 0

Pandas 不读取 Excel 的第一行

我目前在使用 panda 的 read_excel 函数时遇到问题。 # 创建一个包含所有数据点的数据框 df = pd.read_excel(数据路径) df.columns = df.iloc[0] 打印(df.iloc[0]) df = df.

回答 1 投票 0

如何解决“+ 不支持的操作数类型:'float' 和 'str' 错误”?

我尝试通过Python对2个Excel进行合并和求和,但是当我使用“for循环”时,我发现一个错误“+的操作数类型不受支持:'float'和'str'” 请参阅下面我的代码: 导入熊猫...

回答 1 投票 0

定义对等组并计算对等组分析

我想计算每个相关组的平均值。每个名称都有两个组和一个值。我想定义每个名称的相关组是什么,然后获取该组的平均值

回答 1 投票 0

如何在 pandas 数据帧行中检测到第一个非 nan 值后找到前 5 个值(包括 nan)?

如果我有一个像这样的 Pandas DataFrame: 0 1 2 3 4 5 6 7 一个 NaN NaN NaN 1 2 5 6 2 B 南 南 南 2 南 1 南 3 C 5 4 3 2 1 5 9 ...

回答 2 投票 0

Pandas:使用 Xarray 限制 __repr__ 和 _repr_html_ 行为

我在数据框中存储大型 xarray,但每次在 Jupyter 或终端中显示数据框时,它都会花费很长时间(10 行数据框需要 11 秒)。我想它有一些东西......

回答 1 投票 0

我可以用 Polars 优化这个 CPU 密集型 Pandas 代码吗?

我有这个熊猫代码: def last_non_null(s): 返回 s.dropna().iloc[-1] 如果不是 s.dropna().empty 否则 np.nan def merge_rows_of_final_df(df_final): # 按 A、B 和 C 列分组 科尔斯...

回答 1 投票 0

如何从数据帧值而不是字符串中获取列表

我有一个excel文件,其结构如下: 标题 列表 标题_1 ['str_1','str_2'] 标题_2 ['str_3','str_4'] 我想获取 json 结构中的数据,如下所示: {“0”:{“...

回答 1 投票 0

计算pandas数据框中值的n天高/低排名

这是我的数据集,其中索引为日期和价格列。我想在这里创建一个列参数(param),在评论栏中如下所示: 指数价格|参数通讯...

回答 2 投票 0

每组中每第 n 行有一只熊猫

假设组有超过 n 个成员,我想从每个组中取出第 n 行。我查看了https://pandas.pydata.org/pandas-docs/version/0.17.0/ generated/pandas.core.groupby.GroupBy.nt...

回答 1 投票 0

如何使用名称列表更改 pandas Dataframe 中的列名称?

我一直在尝试使用名称列表更改 pandas 数据框的列名称。正在使用以下代码: df.rename(列 = list_of_names, inplace=True) 不过我有一个类型...

回答 6 投票 0

将字典写入 Excel - Python-Pandas

我正在尝试将Python字典转换为Excel文件。但我没有设法按照我想要的 Excel 文件的方式格式化数据框。 我有一个形状如下的字典:

回答 1 投票 0

在 pandas 数据框中保留包含文本的列

我想保留包含单词“FAIL”的列。 输入数据: 价值观1 价值观2 价值观3 状态1 状态2 状态3 1 1 1 经过 经过 失败 2 2 2 经过 经过 经过 3 3 3 经过 经过 经过 4 4 4

回答 2 投票 0

从列创建数据框

我有一个数据帧 df ,其中有一个列预测。列预测的值是字典列表。典型的行列预测如下所示: [{'answer': '我的...

回答 1 投票 0

imblearn 管道中的类型错误:类型“管道”不可下标

transform = [("ord", OrdinalEncoder(), ['工作', '教育']), ("ohe", OneHotEncoder(), ['联系人', '月份', 'poutcome'])] ct = ColumnTransformer(变换, 剩余...

回答 1 投票 0

将 Pandas 时间戳舍入为分钟

我想使用 pd_date_range() 根据开始和结束时间戳(自纪元以来以微秒为单位给出)以 1 分钟为间隔创建一个 DateTimeIndex。为此,我需要舍入开始时间...

回答 6 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.