摘 要:随着计算机技术的飞速发展,快速增长的数据量与匮乏的信息量形成了鲜明的对比,要想从中挖掘出有价值的信息,就要对数据进行专业化处理。本文简单介绍了数据挖掘与关联规则,并采用关联规则算法对超市商品间的销售进行了分析,同时对关联规则算法(Apriori算法)进行了改进,并将基本算法与改进后的算法——AprioriTid算法、DHP算法、Partition算法进行了比较,改善了关联规则算法的缺陷,得到了一些有用的信息,将有利于提高超市的销售额,增强市场竞争力。75689
毕业论文关键词:数据挖掘,关联规则,关联规则算法,AprioriTid算法,DHP算法,Partition算法
Abstract: With the rapid development of computer technology, the rapidly rising amount of data is contrary to the deficient information quantity。 It’s necessary to process the data to dig out some valuable information。 This article is introduced data mining association rules briefly and analyzed the sales of supermarket goods by adopting association rules algorithm。 Meanwhile, the association rules algorithm( Apriori Algorithm)were improved, then a comparison is given which between basic algorithm and an improved one—AprioriTid Algorithm, DHP Algorithm, Partition Algorithm。 The association rules algorithm was improved, and we get some valuable information, which is beneficial to raise the turnover of supermarket and strengthen the market competitive force。
Keywords: data mining, association rules, Apriori Algorithm, AprioriTid Algorithm, DHP Algorithm, Partition Algorithm
目 录
1 引言 5
1。2 研究的必要性 5
1。3 论文的研究内容与结构 6
2 关联规则挖掘算法——Apriori算法 6
2。1 数据挖掘 6
2。2 关联规则 7
2。3 在超市消费关联性中的研究 8
3 对Apriori算法的改进14
3。1 AprioriTid算法14
3。2 DHP算法20
3。3 Partition算法23
4 算法对比23
5 总结与展期24
参考文献 25
致谢 26
1 引言
1。1 研究的背景与现状
随着计算机技术的飞速发展,人们在各行各业都利用到了计算机,它给咱们的生活带来了许多的便利。然而,计算机带给我们的越来越多的数据量和越来越少的信息量却形成了鲜明的对比。比如,超市里通过对条形码的扫描,生成了超市的销售数据,这些数据包含了客户的购买需要。但是,由于现在存储的数据越来越多,并且不断地积累成了以前的办法所不能处理的大数据,我们又没有能够对这些数据进行专业化的处理,所以不能从这些数据中获得更加有用的信息,导致人们一边陷入了“数据的海洋”,一边却在感叹着“知识的匮乏”。如果我们能从这些数据中挖掘出潜在的关系、有用的信息,那么便能为人们带来便利,为商家自己带来最大的利益,其中最经典的就是“尿布与啤酒”的案例。这个营销界的神话讲的是美国的沃尔玛超市,高层们发现每到周末,尿布和啤酒的销量就会一起上升,于是就对这一奇怪的现象进行了调查分析,发现了其中的奥秘,原来,美国的妇女们经常会吩咐她们的丈夫下班以后为孩子买尿布,而丈夫在买完尿布以后会顺便为自己买喜欢喝的啤酒,因此啤酒和尿布在一起购买的机会还是很多的,于是商家对商品的摆放进行了相应的调整,所以,尿布与啤酒的销量更多了,商家也获得了更大的利润。这都得益于商家对购物单中冗杂的数据进行了深度挖掘,对客户的消费进行了关联规则的研究。