顺序模式或项集 fp 树

问题描述 投票:0回答:1

FP 增长算法用于项集挖掘。有没有办法使用这些算法进行序列模式挖掘而不是项集挖掘?

data-mining
1个回答
0
投票

FPGrowth 算法被定义用于在事务上查找项集。因此,它不关心项目的顺序,并且每个项目在一次交易中只能出现一次。

如果您想将其应用于序列以查找顺序模式,那么这是一个更普遍的问题。换句话说,项集挖掘是顺序模式挖掘的一个特例。要解决这个问题,您需要概括 FPGrowth。首先,您需要修改 FPTree 以存储项目可以多次出现的序列。这意味着改变树枝的创建方式。但您还需要更改表示项目的节点之间的链接的处理方式,因为同一项目可以在每个序列中出现多次。

但这真的是个好主意吗?我对此不太确定。有许多顺序模式挖掘算法。例如,您可以使用我的 SPMF 数据挖掘库(http://www.philippe-fournier-viger.com/spmf/)中用 Java 实现的几个实现,因此您不需要自己实现它。

© www.soinside.com 2019 - 2024. All rights reserved.