需要使用 Python 实现具有自定义高尔斯距离度量的 KNN 回归吗?

问题描述 投票:0回答:1

我有一个样本数据集,想要使用 gowers 距离来查找 KNN 回归的邻居

输入数据示例:


import pandas as pd
import numpy as np

df = pd.DataFrame([[1,2.6,'A'],[12,5,'X'],[4,7,'A']])
df.columns = ['Num_1','Num_2','Cat_1']

如数据中所示,我有分类变量和数值变量,需要自定义度量函数来拟合 Kneigbors 种植者距离吗?

python machine-learning knn
1个回答
0
投票

您可以使用

get_dummies()
将分类列转换为布尔列列表。

import pandas as pd
import numpy as np

df = pd.DataFrame([[1, 2.6, 'A'], [12, 5, 'X'], [4, 7, 'A']])
df.columns = ['Num_1', 'Num_2', 'Cat_1']

df = pd.concat([df, df['Cat_1'].str.get_dummies()], axis=1)
df.drop(columns=['Cat_1'], inplace=True)
display(df)

结果:

© www.soinside.com 2019 - 2024. All rights reserved.