陶岳
- 作品数:4 被引量:12H指数:2
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 关系数据库上基于元组组合的关键字查询被引量:9
- 2011年
- 在传统的关系数据库上进行关键字查询已经成为近来数据库领域的研究热点,现有的工作都是以单个元组作为结果单元来返回.为了满足用户对于返回多元组的要求,提出了基于元组组合的关键字查询的概念,并通过返回元组组合来响应查询.通过对问题的分析得到了一系列启发式剪枝策略,设计了一个综合的优化算法.通过一系列真实数据集和人工数据集上的实验,验证了优化算法在绝大部分情况下比最初的算法在性能上有了显著的提高.
- 陶岳何震瀛张家琪
- 关键词:关键字查询组合查询候选集关系数据库
- 关系数据库上基于元组组合的关键字查询
- 在传统的关系数据库上进行关键字查询已经成为近来数据库领域的研究热点,现有的工作都是以单个元组作为结果单元来返回。为了满足用户对于返回多元组的要求,提出了基于元组组合的关键字查询的概念,并通过返回元组组合来响应查询。通过对...
- 陶岳何震瀛张家琪
- 关键词:关键字查询组合查询候选集关系数据库
- 关系数据库上基于组的关键字查询研究
- 关系数据库用来存储结构化数据,并使用SQL语言对数据进行查询,这种方式需要用户掌握这种语言的语法以及数据库的模式知识,因此对用户来说门槛比较高。而互联网上信息检索常常使用关键字查询的方式,这种方式简单、易用,受到普通用户...
- 陶岳
- 关键词:关键字查询关系数据库
- GCPR:一种在MapReduce平台上基于图划分的PageRank加速方法被引量:2
- 2012年
- 随着应用的扩展,大规模图数据不断涌现,如何对拥有大量结点的图进行分析成为研究者关注的焦点问题之一.结点的海量性与分析的复杂性使得图分析任务需要借助MapReduce平台多机并行完成.在该平台上,现有的PageRank算法每轮迭代都须扫描、传输所有网页的完整状态,I/O和网络传输的开销严重影响了计算效率.为此,本文提出一种在MapReduce平台上基于图划分的PageRank加速方法:GCPR(Graph-clustering PageRank).GCPR利用图划分、数据两层压缩技术在MapReduce平台上进行PageRank迭代计算,不仅减少了Map到Reduce中间阶段I/O和网络传输的开销(MapReduce运算的主要瓶颈之一),而且平衡了计算资源.实验证明GCPR能极大提升MapReduce平台上的PageRank计算效率.
- 廖松博陶岳何震瀛汪卫
- 关键词:PAGERANKMAPREDUCE图划分