Pandas:如果 .append 已被弃用,如何将数据帧追加到自身? [重复]

问题描述 投票:0回答:1

学习数据科学:Pandas 完整教程

我正在按照本教程学习一些用于数据分析的基本 Python,但我开始意识到它可能已经过时了。有一个部分将现有数据帧中的行复制并附加到自身,以便生成一些重复项,以便我们稍后进行重复数据删除。不幸的是,当我尝试将数据帧附加到自身时,教程代码失败了...经过一些谷歌搜索,我注意到 .append 可能已从 Pandas API 中弃用...是否有解决方法,以便我可以简单地移动继续本教程的其余部分吗?

处理重复项

此数据集没有重复行,但验证您没有聚合重复行始终很重要。

为了演示,我们只需将电影 DataFrame 附加到自身即可将其加倍:

temp_df = movies_df.append(movies_df)

temp_df.shape
OUT:
(2000, 11)

Using append() will return a copy without affecting the original DataFrame. We are capturing this copy in temp so we aren't working with the real data.

Notice call .shape quickly proves our DataFrame rows have doubled.


I've tried searching for a workaround, but have not found the exact same scenario
python pandas dataframe jupyter-lab
1个回答
0
投票
可以使用

concat
代替追加:

import pandas as pd

df = pd.DataFrame({'col1' : [1,2,3]})

df = pd.concat([df,df]).reset_index(drop = True)

print(df)

给予:

   col1
0     1
1     2
2     3
3     1
4     2
5     3
© www.soinside.com 2019 - 2024. All rights reserved.