我正在尝试从我的数据框中的一列中删除所有不相关的信息,但不知道如何执行。我将数据从CSV文件直接导入到数据框。
0 [{"id": 28, "name": "Action"}, {"id": 12, "nam...
1 [{"id": 12, "name": "Adventure"}, {"id": 14, "...
2 [{"id": 28, "name": "Action"}, {"id": 12, "nam...
4798 [{"id": 28, "name": "Action"}, {"id": 80, "nam...
4799 [{"id": 35, "name": "Comedy"}, {"id": 10749, "...
4800 [{"id": 35, "name": "Comedy"}, {"id": 18, "nam...
我只想拥有动作,喜剧,冒险等类型。如果有人可以帮助我或向我发送正确的指导,这将不胜感激。
这里是一个例子:
ID Name
1 Action
2 Comedy
3 Adventure
def printOneCol():
my_sheet = 'Sheet1'
file_name = 'C:/Users/you/Desktop/test.xlsx'
df = pd.read_excel(file_name,sheet_name=my_sheet, usecols='B:B')
print(df.to_string(index=False))
这是通过使用excel。您可以使用usecols='B:B'
希望有帮助。
您可以使用apply
方法将功能应用于列。
df[column_name] = df[column_name].apply(lambda x: x if x in ['action', 'comedy', 'adventure'] else None)