如何获得熊猫或numpy中的列表列的唯一值,例如第二列>
将导致'动作','犯罪',戏剧'。我能提出的最接近的(但仍然没有功能的)解决方案是:
genres = data['Genre'].unique()
但是这可预见地导致TypeError指出列表不可散列的方式。
TypeError: unhashable type: 'list'
设置似乎是个好主意,但
genres = data.apply(set(), columns=['Genre'], axis=1)
但也会导致TypeError: set() takes no keyword arguments
如何获取熊猫或numpy中的列表列的唯一值,以使第二列将导致“动作”,“犯罪”,话剧。我可以提出的最接近的(但仍未起作用的)解决方案...
以下是一些选项:
[如果您只是想提取信息而不是不添加回DataFrame,则可以在for循环中使用Python的set方法:
如果只想查找唯一值,我建议使用itertoos.chain.from_iterable
连接所有这些列表
不确定是否正是您想要的,但这将使您可以将其转换为集合。
您可以使用explode
: