k个最近邻居回归本质上是否较慢?

问题描述 投票:0回答:1

我正在尝试使用来自scikit的k个最近邻居实现在相当大的数据集上学习。问题在于,预测要花很长时间,几乎和没有意义的训练一样长。这是算法的问题,还是scikit learning不是针对大型数据集(不支持GPU)的事实。

有关更多信息,我试图基于x,y,z和物体标签来预测激光雷达的强度。每次激光雷达扫描都有100,000个点,因此我试图预测每个点的强度。

python machine-learning scikit-learn knn
1个回答
0
投票

尝试使scikit-learn的KNeighborsClassifier运行更快的东西:

  • 不同的KNeighborsClassifier参数:algorithmkd_tree用于低维数据,ball_tree用于高维数据
  • brute参数。使用较大的n_jobs并不一定会使事情变快,有时反之亦然。
  • 请确保您使用的是最新版本:n_jobs中的性能已有改进,并且某些尚未合并的优化(v0.22
  • 使用外部近似最近邻居库(例如scikit-learn#14543)以及使用Annoy预先计算的稀疏距离
© www.soinside.com 2019 - 2024. All rights reserved.