梁晓
- 作品数:1 被引量:12H指数:1
- 供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于多叉树的并行Apriori算法被引量:12
- 2015年
- 在云计算环境下,如何在大数据中进行关联规则挖掘是目前研究的重点和热点.目前已有的并行Apriori算法访问数据库频繁,时间复杂度高,且存储开销大.据此提出一种基于多叉树的并行Apriori算法.首先,依据垂直分割的思想,将原事务数据库转换为布尔型项目数据库并用二进制形式存储.其次,将记录集分割成n个子集,由多个节点并行计算,并使用多叉树结构存储频繁项.方法用于某网络安全态势感知系统后的结果表明,该算法与现有方法相比减小了对数据存储空间的要求,降低了数据库的访问次数,缩短了算法的运行时间.
- 郭方方梁晓王慧强钱真陈江涛
- 关键词:数据挖掘关联规则多叉树