多维轨迹聚类

问题描述 投票:0回答:1

我有一个包含多个飞行轨迹的大数据集。这些轨迹都有一个唯一的 id 来标识它们。它们位于经典的 pandas Dataframe 中。轨迹的每个样本都有多个特征,如经度、纬度、高度、速度等等,如 15 个维度。

我的目标是找到一种可以将整个多维轨迹作为输入的聚类算法,并且它只会根据轨迹的整个轨迹对轨迹进行聚类。

它应该是一个具有动态数量的簇的算法,所以 k-mean 不起作用

我尝试使用 DBSCAN 对它们进行聚类,但问题是,一条轨迹对其内部的样本具有不同的聚类标签。只能将每个样本的样本输入 DBSCAN,而不是整个轨迹。

我也在考虑将轨迹转换为单行,但这最终会导致许多维度,我猜这将导致维度的诅咒。

我也听说过距离矩阵,但它们不是也会以多个维度结尾,因此无法输入 DBSCAN 吗?

我将非常感谢有用的答案!

python machine-learning scikit-learn deep-learning cluster-analysis
1个回答
0
投票

如果您纯粹对轨迹聚类感兴趣,那么我假设您可以只考虑(至少作为起点)经度、纬度和海拔。这听起来像是一个很普遍的问题。对“轨迹之间的距离”的搜索很快就会产生结果。例如轨迹距离测量和性能评估调查。对于 R (不是你想要的,我知道)我找到了 https://cran.r-project.org/web/packages/trajectories/vignettes/article.pdf。搜索“轨迹之间的距离 python”给出了几个结果,但没有任何一个可以作为开箱即用的 3D 工作解决方案脱颖而出。通过这些链接也许您可以更好地解决问题。

© www.soinside.com 2019 - 2024. All rights reserved.