我刚刚想到了DBSCAN的一些特殊情况。情况显示为here。假设eps等于圆的半径。对于MinPts = 3,p和r是核心点。不清楚q是否属于p或r的簇。如果使用递归实现,并且算法首先检查r,则q将成为r集群的一部分。因此,p将定义仅包含两个元素的聚类。原始的paper指出:“请注意,包含wps的群集。Eps和MinPts至少包含MinPts点[...]”我在这里错过了什么吗?还是不考虑这种特殊情况?
例如,q也是核心点:圆中有三个点:p,q,r。在此示例中,您需要minPts = 4。
您需要从高效算法输出中区分出密度簇的theoretical定义,这只有“几乎”可以给出理论结果,这有充分的理由:在理论模型中,q将是两个簇的一部分。但这对users。
不方便且令人惊讶在以后的文章中
[Erich Schubert,JörgSander,Martin Ester,Hans-Peter Kriegel和Xiaoxiao Xu。 2017年。重新审视DBSCAN,重访:为什么以及如何(仍然)使用DBSCAN。 ACM Trans。数据库系统。 42、3,第19条(7月2017),21页。https://doi.org/10.1145/3068335
有脚注:
请注意,在少数情况下,如果可到达的边界点太多,则可能导致集群的点数少于minPts由不同的群集组成,并且先前已分配给其他群集。每个集群至少将有一个核心点。可以实施多次分配以精确表示理论模型(或最短距离的分配)轻松。