[我正在尝试从一个具有经常一起销售的产品项目集的数据集中挖掘频繁的项目集。
示例项集:
A,B,C,D,E
A,B
B,E
A,B
B,C
B,C,E
A,C,F,G
D,H,
I,J,K,L
A,J,K
L,C,F
C,B
我使用eclat函数的先验来获取项目集
rules <- apriori(tr, parameter = list(supp=0.01, conf=0.5,target="frequent itemsets")
有什么方法可以限制这些itemsets以仅基于具有特定长度(订单)的交易生成,例如仅针对具有2个项目或3个项目的交易,依此类推。
因此,例如,当我要为频繁的项目集挖掘长度为2的项目集时,我应该只看到
count
A,B 2 and not 3 because {A,B,C,D,E} doesn't qualify
B,E 1
B,C 2
D,H 1
我正在尝试在包含经常一起销售的产品项目集的数据集中挖掘频繁的项目集。示例项目集:A,B,C,D,EA,BB,EA,BB,CB,C,EA,C,F,GD,H,I,J,K,...
如果我理解的正确,那么您想要创建交易并将其子集化,因此您仅保留恰好包含2个项目的交易。这是您的操作方式: