清洗分类的数据框列

问题描述 投票:0回答:2

我正在尝试从我的数据框中的一列中删除所有不相关的信息,但不知道如何执行。我将数据从CSV文件直接导入到数据框。

0       [{"id": 28, "name": "Action"}, {"id": 12, "nam...

1       [{"id": 12, "name": "Adventure"}, {"id": 14, "...
2       [{"id": 28, "name": "Action"}, {"id": 12, "nam...


4798    [{"id": 28, "name": "Action"}, {"id": 80, "nam...
4799    [{"id": 35, "name": "Comedy"}, {"id": 10749, "...
4800    [{"id": 35, "name": "Comedy"}, {"id": 18, "nam...

我只想拥有动作,喜剧,冒险等类型。如果有人可以帮助我或向我发送正确的指导,这将不胜感激。

python pandas knn
2个回答
0
投票

这里是一个例子:

 ID    Name

 1     Action
 2     Comedy
 3     Adventure




 def printOneCol():
       my_sheet = 'Sheet1'
       file_name = 'C:/Users/you/Desktop/test.xlsx'
       df = pd.read_excel(file_name,sheet_name=my_sheet, usecols='B:B')
       print(df.to_string(index=False))

这是通过使用excel。您可以使用usecols='B:B'

指定哪一列

希望有帮助。


0
投票

您可以使用apply方法将功能应用于列。

df[column_name] = df[column_name].apply(lambda x: x if x in ['action', 'comedy', 'adventure'] else None)
© www.soinside.com 2019 - 2024. All rights reserved.