我有一个样本数据集,想要使用 gowers 距离来查找 KNN 回归的邻居
输入数据示例:
import pandas as pd import numpy as np df = pd.DataFrame([[1,2.6,'A'],[12,5,'X'],[4,7,'A']]) df.columns = ['Num_1','Num_2','Cat_1']
如数据中所示,我有分类变量和数值变量,需要自定义度量函数来拟合 Kneigbors 种植者距离吗?
您可以使用
get_dummies()
import pandas as pd import numpy as np df = pd.DataFrame([[1, 2.6, 'A'], [12, 5, 'X'], [4, 7, 'A']]) df.columns = ['Num_1', 'Num_2', 'Cat_1'] df = pd.concat([df, df['Cat_1'].str.get_dummies()], axis=1) df.drop(columns=['Cat_1'], inplace=True) display(df)
结果: