Scikit-Learn DBSCAN创建具有两个高度断开的孤岛的集群

问题描述 投票:0回答:1

在这种情况下:一张图片值得一千个单词 ..

Hello Purple Cluster!

enter image description here

这是怎么发生的?首先-描述DBSCAN的数据和设置:

  • 100个数据点
  • 使用custom距离度量来生成预计算距离矩阵
  • 自定义距离度量很简单:仅考虑r0(x距离)

除了紫色一对盗贼之外的所有东西>看起来都与期望的一样。那个紫色的簇是如何跃过Yellow Wall并声称左上角那对流氓点?

更新

已经验证了确实存在三个群集。即这不是选择三种颜色表示四个群集的错误。验证直接来自dbscan预测的输出(不是我的某些假设):

这里是:

NumClusters is 3 counts are (array([-1,  0,  1]), array([ 8, 67, 25]))

另一个更新

要澄清:2个紫色点被添加到最右边的簇(也为紫色)。它们是not和fourth簇。所以问题是-为什么将这些点添加到最远距离群集中而不是附近的绿色和黄色群集中?]

在这种情况下:一张图片值得一千个单词..你好,紫色集群!这是怎么发生的?首先-描述DBSCAN的数据和设置:使用自定义...

python scikit-learn dbscan
1个回答
0
投票

这很有趣。我添加了cluster number

© www.soinside.com 2019 - 2024. All rights reserved.