高松松
- 作品数:1 被引量:10H指数:1
- 供职机构:重庆邮电大学更多>>
- 发文基金:重庆市自然科学基金重庆市教育委员会科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce的关联规则并行增量更新算法被引量:10
- 2014年
- 针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题。在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP-tree)的基础上,引入MapReduce并行编程模型,提出了一个面向大数据的并行的关联规则增量更新算法(parallel fast updated frequent pattern tree,PFUFP-tree)。该算法通过构建原始事务数据的分块索引,从而使得在每次增量更新时,能够最小化地扫描原始事务数据库,提高了挖掘效率;同时采用动态负载均衡的项目分组策略来优化并行计算过程中的项集分组问题,从而保证分布式集群中节点之间的负载均衡;实验结果证明,提出的算法是有效的和高效的,适用于动态增长的大数据环境。
- 杨勇高松松
- 关键词:关联规则大数据MAPREDUCE