熊猫从列表列中获得唯一值

问题描述 投票:2回答:5

如何获得熊猫或numpy中的列表列的唯一值,例如第二列>

enter image description here

将导致'动作','犯罪',戏剧'。我能提出的最接近的(但仍然没有功能的)解决方案是:

 genres = data['Genre'].unique()

但是这可预见地导致TypeError指出列表不可散列的方式。

TypeError: unhashable type: 'list'

设置似乎是个好主意,但

genres = data.apply(set(), columns=['Genre'], axis=1)

但也会导致TypeError: set() takes no keyword arguments

如何获取熊猫或numpy中的列表列的唯一值,以使第二列将导致“动作”,“犯罪”,话剧。我可以提出的最接近的(但仍未起作用的)解决方案...

python pandas numpy unique
5个回答
1
投票

以下是一些选项:


0
投票

[如果您只是想提取信息而不是不添加回DataFrame,则可以在for循环中使用Python的set方法:


0
投票

如果只想查找唯一值,我建议使用itertoos.chain.from_iterable连接所有这些列表


0
投票

不确定是否正是您想要的,但这将使您可以将其转换为集合。


0
投票

您可以使用explode

© www.soinside.com 2019 - 2024. All rights reserved.