我将非常感谢有关此挑战的任何建议,我正在尝试找到数据集(矩阵)的相关性,该数据集(矩阵)包含行上的客户和他们按列拥有的竞争对手产品(拥有='是',不拥有='否')以及另一个拥有我们品牌的客户数据集(拥有=1,不拥有=0)。我可以使用任何机器学习模型或算法来根据客户拥有的产品来预测客户的适合度吗?请记住,我们品牌数据集中的所有零值都是潜在客户。
我尝试了随机森林,但我们对拥有我们品牌的客户的所有价值观都是积极的,我如何根据所有积极的价值观来预测适合度?。
这是机器学习中一类学习问题的教科书示例。我想您想要做的是根据竞争对手产品的所有权来预测客户是否适合您的品牌。我建议为此使用 One-Class SVM 模型。
在示例中,我使用示例数据集,但您需要将其替换为实际数据。对于竞争对手的产品所有权,此处 0 = 否,1 = 是。在预测中,-1 表示异常值(不太拟合),1 表示内部值(潜在拟合)。此外,对于分数而言,分数越高表示更适合:
from sklearn.svm import OneClassSVM
import numpy as np
X_train = np.array([[0, 1, 0], [1, 1, 0], [1, 0, 1]])
model = OneClassSVM(gamma='auto').fit(X_train)
X_new = np.array([[0, 0, 0], [1, 0, 0], [1, 1, 1]])
predictions = model.predict(X_new)
scores = model.score_samples(X_new)
print(predictions)
print(scores)
返回
[-1 -1 -1]
[0.88947568 0.95544697 0.95544697]