我想找到apriori算法的最小支持阈值。我知道它完全取决于用户和数据集,但是我发现了一篇使用指数衰减函数的文章。http://data-mining.philippe-fournier-viger.com/how-to-auto-adjust-the-minimum-support-threshold-according-to-the-data-size/这是根据先验算法导出公式的链接。我想知道如何确定常量“ a”,“ b”的值,因为它们也可以根据用户的不同而不同。据说“ c”是最小可能的支撑。我使用内置的python mlxtend
包生成频繁的项目集,其中min_support
充当输入之一。因此,我们如何在使用apriori
方法之前确定“ c”,并从此生成最小可能的支持]
必须选择a,b和c而不是只选择一个以上的参数...
我认为这个方程式的意思是随着数据集的增长,随着时间的推移调整您的参数。但是似乎您已经找到多个合适的参数来计算a和b。