张芮
- 作品数:1 被引量:4H指数:1
- 供职机构:浙江工商大学信息与电子工程学院更多>>
- 发文基金:浙江省自然科学基金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce技术的并行集成分类算法被引量:4
- 2012年
- 由于计算机内存资源限制,分类器组合的有效性及最优性选择是机器学习领域的主要研究内容。经典的集成分类算法在处理小数据集时,拥有较高的分类准确性,但面对大量数据时,由于多基分类器学习、分类共用1台计算机资源,导致运算效率较低,这显然不适合处理当今的海量数据。针对已有集成分类算法只适合作用于小规模数据集的缺点,剖析了集成分类器的特性,采用基于聚合方式的集成分类器和云计算的MapReduce技术设计了并行集成分类算法(EMapReduce),达到并行处理大规模数据的目的。并在Amazon计算集群上模拟实验,实验结果表明该算法具有一定的高效性和可行性。
- 琚春华邹江波张芮魏建良
- 关键词:云计算集成分类器MAPREDUCE