周烜
- 作品数:21 被引量:771H指数:4
- 供职机构:中国人民大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 一种基于FPGA的内存OLAP查询优化方法
- 本发明涉及一种基于FPGA的内存OLAP查询优化方法,其步骤:构建面向内存‑闪存的数据仓库异构存储模型;基于异构存储模型面向CPU‑FPGA异构处理器的查询优化:通过子查询生成一个分组投影向量;对分组投影向量进行字典表压...
- 张延松张宇柴云鹏周烜王珊
- 文献传递
- 内存列存储数据库中优化的混合自适应索引
- 分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐增强.大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统的初始配置任务更加繁重,例如索引创建等;其次,在分析过...
- 薛忠斌周烜张延松吴欣周新王珊
- 文献传递
- 混合的大规模数据库自动模式抽象方法
- 数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实...
- 王雪周烜王珊
- 关键词:大规模数据库优化算法
- 内存数据仓库集群技术研究被引量:2
- 2014年
- 随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库团队在内存数据仓库集群技术方面的研究工作,包括:以列分布和列计算服务为中心的ScaMMDB内存数据仓库集群,以水平分片、并行计算为中心的ScaMMDBⅡ和reverse-star schema分布、集群向量计算为特征的MiNT-OLAP Cluster等技术的研究发展过程.分析了内存数据仓库集群技术的关键问题及技术挑战,并针对新的内存数据仓库集群应用需求展望未来技术的发展.
- 张延松王珊周烜
- 关键词:集群
- 架构大数据:挑战、现状与展望被引量:622
- 2011年
- 大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍,对未来研究做了展望.
- 王珊王会举覃雄派周烜
- 关键词:大数据MAPREDUCE并行数据库
- 批处理在内存数据处理系统中的应用被引量:1
- 2014年
- 内存数据处理相较磁盘数据处理有明显的速度优势.在基于磁盘的数据管理系统中,设计者往往会花很多精力对事务响应时间进行调优,以提高应用的用户体验.在内存数据管理系统中,由于存储介质的改变,事务响应时间得到极大提升,甚至远远超出应用系统的需求.因此,系统设计者将注意力转移到对吞吐率的优化上.批处理技术的本质是通过牺牲响应时间换取吞吐率,它将在内存计算中得到广泛应用.本文讨论批处理方式在内存数据管理系统中的应用,并以移动对象管理为实际案例,验证批处理在内存数据管理中的优化效果.
- 周烜薛忠斌
- 关键词:内存数据库批处理
- 双流模式下高吞吐量移动对象范围查询算法被引量:1
- 2015年
- 随着位置感知移动设备的出现及通信技术和GPS系统的不断发展,基于位置的查询在数据库领域得到了广泛的关注.研究了基于快照的空间范围查询,即,查询在某个时间段位于某个查询范围内的移动对象.范围查询是其他空间查询的基础,例如KNN查询和反KNN查询等,很容易在范围查询的基础上得到.国内外的研究者针对移动对象的范围查询问题提出了一系列的算法,然而这些算法要么关注于解决移动对象的快速更新问题,要么关注于解决范围查询的快速处理问题.在大数据的背景下,查询和更新大量涌入时,不仅要求查询算法有较快的响应速度,还要求它们能够实现较高的吞吐量,但已有算法不能很好地解决高吞吐量的问题.针对移动对象更新数据流和查询数据流,提出一种基于内存的高吞吐量移动对象范围查询算法——双向流连接(DSJ)算法.双向流连接算法采用基于快照的模式,通过在每个快照中重新构建索引的方式,以避免复杂的索引维护操作,充分发挥了硬件的性能;通过每次执行一组查询的方式,增加了数据的局部性,提高了算法的效率;在执行过程中,通过使用SIMD技术以加速查询处理过程.基于以上几点,双向流连接算法能够确保整个系统具有很高的吞吐量.在基于德国路网生成的数据集上对算法进行了测试,实验结果表明,双向流连接算法具有很好的性能表现.
- 薛忠斌周烜王珊
- 关键词:大数据时空数据库范围查询主存
- 混合的大规模数据库自动模式抽象方法被引量:4
- 2013年
- 随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为"团",然后使用元聚类方法将这些"团"集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.
- 王雪周烜王珊
- 关键词:大规模数据库
- 基于数组存储和向量处理的OLAP查询处理方法
- 本发明公开了一种基于数组存储和向量处理的OLAP查询处理方法。在该方法中,根据数据仓库模式中的参照完整性约束对主-外键进行数组下标映射,使维表主键与事实表外键直接映射为数组下标地址,将复杂的模式转换为一个虚拟物化表,为不...
- 张宇张延松王珊周烜
- 一种基于FPGA的内存OLAP查询优化方法
- 本发明涉及一种基于FPGA的内存OLAP查询优化方法,其步骤:构建面向内存‑闪存的数据仓库异构存储模型;基于异构存储模型面向CPU‑FPGA异构处理器的查询优化:通过子查询生成一个分组投影向量;对分组投影向量进行字典表压...
- 张延松张宇柴云鹏周烜王珊