挖掘频繁项集主要有两类方法,一类是Apriori算法,另一类是FP-Growth算法。本文介绍的FP-Growth算法采用了高效的树结构存储数据,然后从树结构中直接挖掘频繁项集。其一方面较Apriori算法存储小,另一方面也比Apriori算法快,但缺点是在某些数据集上性能会下降。 1.1 关联分析基础知识 关联分析一些基础知识如下。TID Items001 Cola, Egg, Ham002 Cola, Diaper, Beer003 Cola, Diaper, Beer, Ham004 Diaper, Beer1、事务:每一条交易称为一个事务。2、项:交易的每一个物品称为一个项,例如Col...