Apriori算法是一种经典的关联分析挖掘算法. 经典Apriori算法计算效率偏低, 并且需要多次扫描数据库. 针对这些问题,文章提出了基于Hash表改进的Apriori算法. 基于Hash表的改进Apriori算法计算时只需扫描对应频繁项集Hash表中对应的项, 缩小了扫描范围, 并且只需要扫描一次数据库. 对比经典的Apriori算法, 性能具有显著提高.
Abstract
Apriori algorithm is a classic association analysis mining algorithm, but the Apriori algorithm is inefficient and requires multiple scans in the database. In response to these problems, an Improved Apriori Algorithm Based on Hash Tables is proposed here. When the Improved Apriori Algorithm Based on the Hash Tables is calculating, only the corresponding items in the corresponding frequent itemset Hash table need to be scanned, the scanning range is reduced, the calculation efficiency is improved significantly, and the database needs to be only scanned once. Compared with the classic Apriori algorithm, the performance is significantly improved.
关键词
Apriori算法 /
最小支持度 /
频繁项集 /
Hash表
{{custom_keyword}} /
Key words
Apriori algorithm /
minimum support /
frequent itemset /
Hash table
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules in large databases[C]∥International Conference on Very Large Data Bases. Morgan Kaufmann Publishers Inc. 1994:487-499.
[2] 赵洪英,蔡乐才,李先杰.关联规则挖掘的Apriori算法综述[J].四川理工学院学报(自然科学版),2011,24(1):66-70.
[3] 刘兴涛, 石冰, 解英文. 挖掘关联规则中Apriori算法的一种改进[J]. 山东大学学报(理学版), 2008, 43(11):67-71.
[4] 毛国君.数据挖掘技术与关联规则挖掘算法研究[D].北京:北京工业大学,2003.
[5] 钟育彬. 企业综合评价系统中的模糊层次综合评价模型[J]. 广州大学学报(自然科学版), 2005, 4(4):316-320.
[6] 陈文庆, 许棠. 关联规则挖掘Apriori算法的改进与实现[J]. 计算机技术与发展, 2005, 15(8):155-157.
[7] 李超, 余昭平. 基于矩阵的Apriori算法改进[J]. 计算机工程, 2006, 32(23):68-69.
[8] 罗丹, 李陶深. 一种基于压缩矩阵的Apriori算法改进研究[J]. 计算机科学, 2013, 40(12):75-80.
[9] 宋文慧, 高建瓴. 基于矩阵的Apriori算法改进[J]. 计算机技术与发展, 2016, 26(6):62-64.
[10]胡绿慧,任玉兰,何振林.基于划分和压缩数据库的改进Apriori算法[J].成都理工大学学报(自然科学版),2015(1):110-114.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}