王焕东
- 作品数:12 被引量:29H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 片上多处理器的低功耗系统结构研究
- 张戈张锋杨梁徐君范宝侠曹非王焕东郝守青齐子初凡启飞张逸溦王茹段玮
- (1)在片上多处理器的结构级功耗评估技术方面,研究了多核处理器中基本功能电路的功耗建模方法,搭建了基本功能块的物理实现与功耗提取实验板平台,建立了多核结构及功耗模拟器。(2)在动态自适应低功耗处理器核结构方面,以“按需计...
- 关键词:
- 关键词:片上多处理器模拟器
- 基于HyperTransport协议的Cache一致性协议传输方法及系统
- 本发明涉及基于HyperTransport协议的Cache一致性协议传输方法及系统。该包括:将HyperTransport协议的通道与Cache一致性协议的通道对应;新增用于传输写命令附加信息的写命令扩展包、用于传输写命...
- 王焕东高翔
- 文献传递
- 龙芯3号互联系统的设计与实现被引量:23
- 2008年
- 龙芯3号的互联结构设计采用了一种基于二维Mesh的可伸缩分布式多核结构,可为芯片级、主板级和系统级的互联提供统一的拓扑结构和逻辑设计.龙芯3号的对外接口采用扩展的HyperTransport协议,既可以用于连接IO,又可以实现多芯片的互联.在龙芯3号的互联结构中还设置了软件路由配置机制,可以在板级直接构筑中等规模的CC-NUMA系统和更大规模的NCC-NUMA系统,提供高效的通信机制.介绍了基于龙芯3号的多处理器系统互联架构.采用了双层可伸缩互联结构:片内由二维Mesh连接多个结点,结点内由交叉开关连接多个处理器核和二级缓存模块.片间无需额外硬件支持即可通过支持缓存一致性的HyperTransport接口实现16核的多处理器系统.利用层次化目录技术,龙芯3号还可以支持更大规模的多处理器系统.龙芯3号的互联架构为搭建简洁、高效、灵活、高度可扩展的共享存储多处理器系统提供了有力支持.
- 王焕东高翔陈云霁胡伟武
- 关键词:多核体系结构互联处理器
- 一种访存缓冲装置及方法
- 本发明公开了一种访存缓冲装置及方法。所述方法包括下列步骤:上行读通道收到CPU发出的读请求,根据情况,对符合缓冲操作条件的读请求进行缓存,并转发一个包含所述符合缓冲操作条件的读请求的读地址长度的读取更多数据的读请求;对不...
- 王焕东唐丹胡伟武
- 文献传递
- 一种访存缓冲装置及方法
- 本发明公开了一种访存缓冲装置及方法。所述方法包括下列步骤:上行读通道收到CPU发出的读请求,根据情况,对符合缓冲操作条件的读请求进行缓存,并转发一个包含所述符合缓冲操作条件的读请求的读地址长度的读取更多数据的读请求;对不...
- 王焕东唐丹胡伟武
- 文献传递
- 用于多核同步优化的cache一致性协议设计
- 2013年
- 通过对多核同步过程中的访存行为进行分析,提出了一种识别同步类型的方法,并设计了一种实现同步优化的新的cache一致性协议。该协议增加了一个用于记录同步信息的cache状态,通过阻塞的方式可以让多个处理器核串行地完成同步操作,保证同步操作中原子指令能够顺利执行成功,从而大大减少由多核同步冲突引发的访存请求数量,将多核同步过程中的访存行为优化到了几乎最好的情况。实验结果表明,通过同步优化,这个新的cache一致性协议能够使多核同步的性能提升到接近最理想的结果。实验表明,相比传统的cache一致性协议,实验中采用的几个标准多核性能测试程序优化后的同步性能提升了1倍,而并行程序整体运行时间降低25%。
- 陈李维张广飞张广飞汪文祥王焕东
- 关键词:CACHE一致性协议
- 多微通道内存系统设计方法
- 2013年
- 通过建立内存系统排队模型,分析了影响内存系统性能的原因——内存控制器的内存命令处理速度受访存请求页命中率、Bank级并行度和读写命令切换率的影响,进而提出了一种多微通道内存系统设计方法。用此方法多微通道内存控制器通过对内存颗粒进行细粒度控制,可以提高访存请求页命中率和Bank级并行度,隐藏数据总线读写切换延迟。该结构在提高内存系统带宽利用率的同时,缩短访存请求延迟,并提高内存功耗有效性。将多微通道内存控制器设计应用于多核处理器平台,充分分析各种宽度访存通道对应用程序性能的影响。实验结果表明,相比传统内存控制器设计方法,多微通道内存控制器将内存系统带宽提高了21.8%,访存延迟和功耗分别降低14.4%和26.2%。
- 张广飞王焕东陈新科黄帅陈李维
- 关键词:内存控制器多通道
- 面向云计算的多核处理器存储和网络子系统优化设计被引量:6
- 2013年
- 针对传统多核处理器设计缺乏对虚拟机和典型云服务的支持的问题,分析了云计算数据中心和虚拟机的基本架构和特点,指出数据传输、网络性能、I/O虚拟化是一直未被关注的影响系统性能的关键因素,进而提出了一种改进的多核处理器设计方案。该方案通过采用片上内存拷贝引擎、改进直接内存访问(DMA)设计、改进直接缓存访问(DCA)设计和采用快速地址转换和远程内存访问(RDMA)技术,来较大地提高存储系统、网络、I/O的性能和系统的并行性。实验表明,该方案实现的单核800MHz处理器千兆以太网络TCP传输带宽较传统方案提高48.2%并达到峰值800Mbps,内存拷贝操作加速比达到14倍以上,快速傅立叶变换(FFT)和矩阵乘法加速比达到2倍以上,同时系统高速缓存效率显著提高。
- 苏文王焕东台运方王靖
- 关键词:云计算多核处理器网络优化虚拟机计算机体系结构
- 资源有效的单片多处理器结构研究
- 章隆兵张福新高翔侯锐肖俊华郇丹丹黄琨王焕东苏孟豪刘奇
- 随着半导体摩尔定律的进一步延续,单片多核处理器结构(CMP)成为高性能处理器发展的主流。该项目主要研究资源有效的CMP结构设计技术,主要成果包括:(1)开发了功能完善的CMP结构模拟器平台,主要包括:基于龙芯2号结构的单...
- 关键词:
- 基于HyperTransport协议的Cache一致性协议传输方法及系统
- 本发明涉及基于HyperTransport协议的Cache一致性协议传输方法及系统。该包括:将HyperTransport协议的通道与Cache一致性协议的通道对应;新增用于传输写命令附加信息的写命令扩展包、用于传输写命...
- 王焕东高翔
- 文献传递