穆飞
- 作品数:11 被引量:20H指数:3
- 供职机构:清华大学计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划“十一五”国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种面向大规模副本存储系统的可靠性模型被引量:7
- 2009年
- 可靠性对大规模存储系统至关重要,在大规模存储系统中设备失效日趋频繁,副本技术成为提高系统可靠性的主流技术之一.基于Markov模型,针对多副本存储系统建立了度量系统可靠性的理论模型.该模型能够反应失效检测延迟对系统可靠性的影响.通过该模型还可以度量存储系统关键参数如系统规模、副本阶数、单节点容量、单节点平均失效时间、数据对象平均大小、平均修复带宽等对系统可靠性的影响,从而为存储系统的设计提供理论基础.
- 穆飞薛巍舒继武郑纬民
- 关键词:可靠性多副本MARKOV模型
- 一种分布式信息检索系统的设计与实现
- 在海量数据中迅速获取有效信息需要信息检索技术。设计并实现了采用分布式架构的信息检索系统,具有良好的可扩展性;提出了压缩trie树词典构建方法,减少了内存使用,获得了很高的分词性能;提出了基于软件流水线技术的细粒度流水索引...
- 穆飞李维佳薛巍舒继武
- 关键词:分布式架构信息检索汉语分词索引算法TRIE树
- 文献传递
- 深腾2600新型网络服务器系统
- 舒继武肖利民郑纬民祝明发薛巍史小冬陈文光郝沁汾张广艳张健穆飞杨琪罗骏于冰孟冉章宏灿肖达宋冬梅
- “深腾2600新型网络服务器系统”面向国家信息化建设的应用需求,以集群架构组织计算资源,以存储区域网络进行数据存储,实现了统一管理、高性能存储、负载均衡、服务容错、存储容灾、并行数据访问及智能电源管理等功能,有效解决了当...
- 关键词:
- 关键词:网络服务器服务器软件
- 存储区域网络中容灾技术的研究
- 穆飞
- 关键词:存储区域网络容灾多路径备份
- 一种面向大规模存储系统的数据副本映射算法被引量:4
- 2009年
- 提出一种适应动态环境、无需数据映射表的多副本数据对象映射算法.该算法引入节点权重,借鉴一致性Hash技术,使得海量的数据对象按照节点服务能力在各存储节点间均匀分布;当存储节点个数发生变化时,数据依然在节点间均匀分布,且数据迁移量接近理论下限;只需维护少量数据即可计算得到数据布局,从而有效提高了系统的可扩展性.测试结果表明,算法可使所有节点分配对象个数与理论值偏差小于5%,节点个数变化时移动数据数量与理论下限偏差小于1%.
- 穆飞薛巍舒继武郑纬民
- 关键词:动态映射数据副本可扩展性数据迁移
- 大规模存储系统数据组织方法与技术研究
- 穆飞
- 关键词:元数据管理数据副本数据映射可靠性
- 基于定位目录的元数据管理方法被引量:6
- 2009年
- 元数据的访问性能和可扩展性是影响大规模存储系统整体性能的关键因素。该文提出了一种基于定位目录的元数据组织机制。该机制以定位目录作为元数据定位、负载评价以及元数据动态迁移的基础,保持了元数据的目录相关性,提供了较高的元数据访问的性能;在此基础上的负载评价方法以很小的开销反映操作历史信息的影响。测试数据表明,该机制可以提供良好的负载调节能力。
- 穆飞薛巍舒继武郑纬民
- 关键词:元数据管理
- PDPI:一种面向多核的可扩展并行索引算法
- 数据量呈爆炸性增长的互联网环境下,信息检索是快速准确获取信息的有效手段。索引是信息检索系统的重要组成部分,而且是最耗时的部分。针对索引过程,本文提出了面向多核的流水与数据并行混合算法(Pipeline and Data ...
- 薛巍李维佳穆飞舒继武
- 关键词:互联网信息检索可扩展性
- 文献传递
- 一种基于集群环境的虚拟存储系统研究与实现被引量:3
- 2006年
- 虚拟存储管理系统能够根据用户的需要随时在线调整存储卷的容量,而且能够提供快照、在线数据备份等功能,成为存储系统中重要的功能中间件.然而传统的服务器存储管理系统不能适应集群环境下的数据管理,尤其是随着SANs(StorageAreaNetworks)技术的日益发展与普及,研究集群环境下的虚拟存储系统成为迫切任务.本文通过对虚拟存储技术的研究,提出了集群环境下虚拟存储系统的模型CVM,分析了其中的关键技术,并且给出了一个具体的实现方案和测试结果,结果表明,CVM系统能够有效实现共享存储环境下的虚拟存储管理,同时提供了在线数据备份、数据镜像等功能,具有很好的容错特性,较好实现了集群环境下的共享存储管理.
- 李必刚舒继武穆飞郑纬民
- 关键词:存储区域网络快照在线备份
- 一种分布式信息检索系统的设计与实现
- 在海量数据中迅速获取有效信息需要信息检索技术。我们设计并实现了采用分布式架构的信息检索系统,具有良好的可扩展性;提出了压缩 trie 树词典构建方法,减少了内存使用,获得了很高的分词性能;提出了基于软件流水线技术的细粒度...
- 穆飞李维佳薛巍舒继武
- 关键词:信息检索汉语分词索引算法
- 文献传递