国家自然科学基金(6116140454)
- 作品数:2 被引量:1H指数:1
- 相关作者:臧冬松梁栋孙功星霍菁更多>>
- 相关机构:中国科学院康奈尔大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- CMS实验中关系数据库的精确关键词查询被引量:1
- 2014年
- 在大型强子对撞机(LHC)上紧凑型缪子螺线管探测器(CMS)实验的复杂数据环境下,有多个关系型数据源记录了关于数据组织和分布的信息。为实现数据查询系统的精确关键词查询功能,通过分析数据库模式图的方法,将关键词查询语言动态翻译成SQL语言,设计并实现一个跨数据库平台的关键词查询系统。针对动态翻译过程中存在的二义性问题,提出基于查询实体的模式图分析算法,以及基于最小权重树查找的动态连接算法。实验结果表明,该动态连接算法能为关键词查询正确生成所需数据库表的连接方式,使关键词查询系统具有较高的查询效率,以满足用户实时、精确查询的需求。
- 梁栋臧冬松孙功星Valentin Kuznetsov
- 关键词:关键词查询查询语言关系数据库结构化查询语言
- CMS实验元数据发现的数据聚集系统
- 2014年
- 在大型强子对撞机上的紧凑繆子螺线管探测器实验,具有数据量大(PB级规模)、数据类型复杂与数据地理上全球分布的特点。记录上述数据的元数据达到TB级的规模,并且以不同的格式保存在不同的关系和非关系数据源中,通过在这些异构数据源上添加一个缓存层的方法,实现一个提供精确的关键词查询的数据聚集系统。根据多重映射和聚集的方式支持用户的查询,并利用有效的缓存管理策略来提升查询的命中率。实验结果表明,该系统能够通过缓存的方式响应超过70%的用户查询,具有良好的查询性能。
- 梁栋臧冬松霍菁孙功星Valentin Kuznetsov
- 关键词:关键词查询数据聚集缓存管理异构数据源