如何从列表中提取特征?

问题描述 投票:0回答:1

如何像python一样从数据集中提取特征:

enter image description here

我发现解决这个问题的两种方法。1)一个是:

enter image description here

但是enter image description here因此,这不是一个好方法。

2)另一个是:

搜索C和D列以查找topK项,并且仅保留topK。但这会导致信息丢失。

是否有更好的方法来解决此问题?

python pandas scikit-learn feature-extraction sklearn-pandas
1个回答
0
投票

我想我理解您的问题。我列出了一种您可以遵循的方法,不会造成任何稀疏或信息丢失。

  1. 假设您的C列在c1到c4之间变化,并且您已经创建了c1到c4的二进制向量。
  2. 然后将二进制矢量转换为十进制并将其用作功能。 (例如1,1,0,0,-> 0 * 2 ^ 0 + 0 * 2 ^ 1 + 1 * 2 ^ 2 + 1 * 2 ^ 3。
  3. 对D采用相同的方法,但是我建议您创建两个功能。一个类似于步骤2,而没有使用D的值,另一个类似于D的值,同时进行了十进制转换,然后根据两个特征之间的相关性决定保留它们。
© www.soinside.com 2019 - 2024. All rights reserved.