山东省统计科研重点课题(KT12067)
- 作品数:2 被引量:4H指数:1
- 相关作者:孙忠林张峰陈欣韩燕波魏永山更多>>
- 相关机构:山东科技大学北方工业大学更多>>
- 发文基金:山东省统计科研重点课题山东省自然科学基金山东省优秀中青年科学家科研奖励基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种云计算环境下的XML查询数据服务的优化方法被引量:3
- 2013年
- 在云计算环境中提供数据服务逐渐成为研究热点。在云计算环境中结合已有XQuery查询处理引擎,实现了云计算环境中XML数据查询服务。为提高云计算环境中XML数据查询效率,采用基于XPath投影的方法预先对XML分块处理,仅保留与XQuery语句相关的数据。实验表明,该方法有效缩小了数据分块的规模,缩短了XML数据服务的查询处理时间。
- 魏永山张峰陈欣韩燕波孙忠林
- 关键词:云计算环境
- 基于MapReduce的大数据流程处理方法被引量:1
- 2013年
- 处理效率是数据流程处理的重要指标,简单的单服务器结构已经难以适应海量数据的处理任务。为了能够完成海量数据的流程处理任务,简要介绍了Google的MapReduce的结构,Fegaras等剔除的MapReduce查询语言(MRQL),并基于MapReduce编程模型和MRQL提出了一种分布式数据汇聚方法。该方法借助MapReduce完成数据处理流程的执行,借助MRQL控制MapReduce。在XBus数据汇聚平台基础上,结合MapReduce和MRQL实现了MRXBus分布式数据汇聚平台,验证了该方法的可行性。实验表明,该方法可以减少大数据量的处理时间,提高处理效率。
- 王东雷孙忠林
- 关键词:数据汇聚MAPREDUCEHADOOP