DBSCAN群集大小小于MinPts

问题描述 投票:0回答:1

我刚刚想到了DBSCAN的一些特殊情况。情况显示为here。假设eps等于圆的半径。对于MinPts = 3,p和r是核心点。不清楚q是否属于p或r的簇。如果使用递归实现,并且算法首先检查r,则q将成为r集群的一部分。因此,p将定义仅包含两个元素的聚类。原始的paper指出:“请注意,包含wps的群集。Eps和MinPts至少包含MinPts点[...]”我在这里错过了什么吗?还是不考虑这种特殊情况?

algorithm machine-learning parameters cluster-analysis dbscan
1个回答
0
投票

例如,q也是核心点:圆中有三个点:p,q,r。在此示例中,您需要minPts = 4。

您需要从高效算法输出中区分出密度簇的theoretical定义,这只有“几乎”可以给出理论结果,这有充分的理由:在理论模型中,q将是两个簇的一部分。但这对users

不方便且令人惊讶

在以后的文章中

[Erich Schubert,JörgSander,Martin Ester,Hans-Peter Kriegel和Xiaoxiao Xu。 2017年。重新审视DBSCAN,重访:为什么以及如何(仍然)使用DBSCAN。 ACM Trans。数据库系统。 42、3,第19条(7月2017),21页。https://doi.org/10.1145/3068335

有脚注:

请注意,在少数情况下,如果可到达的边界点太多,则可能导致集群的点数少于minPts由不同的群集组成,并且先前已分配给其他群集。每个集群至少将有一个核心点。可以实施多次分配以精确表示理论模型(或最短距离的分配)轻松。

© www.soinside.com 2019 - 2024. All rights reserved.