确定先验算法中频繁项集生成的最小支持阈值

问题描述 投票:0回答:1

我想找到apriori算法的最小支持阈值。我知道它完全取决于用户和数据集,但是我发现了一篇使用指数衰减函数的文章。http://data-mining.philippe-fournier-viger.com/how-to-auto-adjust-the-minimum-support-threshold-according-to-the-data-size/这是根据先验算法导出公式的链接。我想知道如何确定常量“ a”,“ b”的值,因为它们也可以根据用户的不同而不同。据说“ c”是最小可能的支撑。我使用内置的python mlxtend包生成频繁的项目集,其中min_support充当输入之一。因此,我们如何在使用apriori方法之前确定“ c”,并从此生成最小可能的支持]

python data-mining apriori
1个回答
0
投票

必须选择a,b和c而不是只选择一个以上的参数...

我认为这个方程式的意思是随着数据集的增长,随着时间的推移调整您的参数。但是似乎您已经找到多个合适的参数来计算a和b。

© www.soinside.com 2019 - 2024. All rights reserved.