2。3 在超市消费关联性中的研究来*自~优|尔^论:文+网www.youerw.com +QQ752018766*
关联规则(Apriori)算法是一种频繁项集算法 ,是挖掘布尔关联规则中最有影响的一种算法,是一种递推算法,基于两阶段频集思想,在分类上属于单层、单维、布尔关联规则,所有支持度大于最小支持度的项集称为频繁项集,简称频集。实现的方法是:先找出所有的频繁项集,它们出现的频繁性至少跟预定义的最小支持度一样;再由频繁项集产生强关联规则,这些规则定要满足最小可信度跟最小支持度;最后使用之前找到的所有频繁项集来产生我们希望的规则,产生仅仅包含集合的项的所有规则,当中,每一条规则的右部只能有一项。一旦规则被生成,那么就只有那些大于用户给定的最小可信度的规则才能留下来。为了能生成所有频繁项集,使用了递推的方法。
实例分析:本论文对某超市的顾客消费清单进行了抽样调查,由于篇幅有限,这里仅列出20个顾客和12种生活用品,将12种商品组成数据库Data,有商品洗发露A、护发素B、卫生纸C、卫生棉D、牙膏E、酸奶F、抽纸G、面纸H、泡面J、肥皂K、洗衣液M、洗面奶N。将20位顾客购买的12种生活用品罗列如下表2-2: