我有大量数据想要使用 Scikit 的 DBSCAN 进行聚类。我用下面的行来做:
dbscanObject = DBSCAN(eps=20, min_samples=15).fit(featureVectors)
不幸的是,这需要很长时间,具体取决于数据集有多大,而且我看不出有什么方法可以监控 DBSCAN 的进度。如何监控算法的进度并估计算法完成所需的时间?
该型号的 scikit 仍然不支持进度条。 支持它的模型是 https://scikit-learn.org/stable/modules/classes.html#module-sklearn.ensemble