如何将numpy字符串数组转换为numpy数组，以使用MultiLabelBinarizer？

Question

我有一个像这样的numpy数组：

l1 = (['United States', 'England', 'South Africa']).

有时它可能有> 1值：

l1 = ([['United States','South Korea'], 'England', 'South Africa'])

我想使用MultiLabelBinarizer来编码这些值。根据scikit-learn文档中的fit_transform文档。参数应该是

y：iterable of iterables每个样本的一组标签（任何可订购和可散列对象）。如果设置了classes参数，则不会迭代y。

如何将这个numpy列表和单个字符串数组转换为集合？

我试过这个：

value = [set(v) for v in l1]
list_2sets = np.asarray(value)

但它似乎无法正常工作。

问题是我没有考虑价值（所有国家）。如果我有这个，我尝试了以下工作：

 mlb.fit_transform(headings.split(', ') for headings in l1)

作为标题列出了所有考虑的价值观：

['England','Spain', ...]

但到目前为止我还没有这些价值观，所以我想尝试在没有“标题”的情况下应用MLB

Answer 1

尝试预处理字符串数组，如下所示：

In [50]: l1 = [[x] if isinstance(x, (str)) else x for x in l1]

In [51]: l1
Out[51]: [['United States', 'South Korea'], ['England'], ['South Africa']]

对于Python 2.x：

In [50]: l1 = [[x] if isinstance(x, (str, unicode)) else x for x in l1]

In [51]: l1
Out[51]: [['United States', 'South Korea'], ['England'], ['South Africa']]

如何将numpy字符串数组转换为numpy数组，以使用MultiLabelBinarizer？

问题描述投票：0回答：1

1个回答

最新问题

如何将numpy字符串数组转换为numpy数组，以使用MultiLabelBinarizer？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1