徐卫志
- 作品数:12 被引量:19H指数:2
- 供职机构:华为技术有限公司更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家杰出青年科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 众核处理器片上同步机制和评估方法研究被引量:11
- 2010年
- 同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.针对片上众核体系结构,提出并实现了两种粗粒度同步机制和一种细粒度同步机制,即片上专用硬件支持的同步机制、基于原语的片上互斥访问同步机制和基于满空标志位的细粒度同步机制;提出了粗粒度同步机制的评估标准和评估方法,并设计了量化评估程序.以片上同构众核处理器Godson-T模拟器和AMDOpteron商业片上多核处理器为平台,评估比较了提出的硬件支持的同步机制与基于原语的同步机制的性能.结果表明,硬件支持可以使得片上众核处理器的同步机制性能明显提高;在传统基于原语的同步机制中,大部分性能损失是由于负载不平衡和同步点的串行化操作而造成的等待时间.
- 徐卫志宋风龙刘志勇范东睿余磊张帅
- 关键词:硬件支持微程序
- 一种实现多线程互斥操作的方法、装置和芯片
- 本发明实施例提供了一种实现多线程互斥操作的方法、装置和芯片,通过在芯片上分布多个锁部件,分别管理不同小核申请锁的申请锁消息和释放锁的释放锁消息,进而能够解决线程数目增多时产生的拥塞问题,提高线程协同执行的速度。该方法包括...
- 徐卫志唐志敏张志敏宋风龙
- 文献传递
- 众核结构上分块LU分解算法的研究
- 2011年
- 针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法。为了评估2Dscatter算法、BRX算法和DABP算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性。在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的。
- 余磊刘志勇马宜科宋风龙徐卫志叶笑春
- 关键词:计算机体系结构加速比负载均衡LU分解
- 一种实现多线程互斥操作的方法、装置和芯片
- 本发明实施例提供了一种实现多线程互斥操作的方法、装置和芯片,通过在芯片上分布多个锁部件,分别管理不同小核申请锁的申请锁消息和释放锁的释放锁消息,进而能够解决线程数目增多时产生的拥塞问题,提高线程协同执行的速度。该方法包括...
- 徐卫志唐志敏张志敏宋风龙
- 文献传递
- 片上众核处理器硬件同步机制研究
- 同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.本文针对片上众核体系结构,提出了两种硬件粗粒度同步机制,集中式同步机制和分布式同步机制,分别通过片上的集中式锁管理器和分布式锁管理器来...
- 徐卫志刘志勇范东睿焦帅张浩宋风龙雷峥蒙余磊
- 文献传递
- 众核处理器片上同步机制和评估方法研究
- 同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.针对片上众核体系结构,提出并实现了两种粗粒度同步机制和一种细粒度同步机制,即片上专用硬件支持的同步机制、基于原语的片上互斥访问同步机制...
- 徐卫志宋风龙刘志勇范东睿余磊张帅
- 关键词:硬件支持微程序
- PartitionSim:一个面向众核结构的并行模拟器被引量:2
- 2011年
- 该文提出了一个面向众核处理器的并行模拟器:PartitionSim.PartitionSim采用了一种新颖的方法——时序分割来加速众核结构模拟.时序分割的提出基于这样的观察:在众核结构中,有些模块之间频繁交互而有的模块之间没有交互.有鉴于此,该方法将目标结构分割成两部分:交互部分和非交互部分.当模拟交互部分时,主机线程严格同步,维持时序精确.当模拟非交互部分时,主机线程通过异步运行,提高模拟速度,并且产生较小的时序损失.文中所述工作在一个16核的SMP机器上用PartitionSim模拟了千核规模的Godson-T众核结构.实验结果显示,PartitionSim展示出良好的加速比,达到最高25MIPS的模拟速度,时序损失平均值为0.92%.
- 焦帅徐卫志唐士斌范东睿孙凝晖
- 一种栅栏同步方法及设备
- 本发明公开了一种栅栏同步方法及设备,涉及通信领域,解决了在线程数目增多的情况下,由于访问瓶颈导致的具有多核或众核处理器的芯片处理性能下降的问题。具体方案为:第一处理器核确定当前处理的线程程序执行到预定的栅栏同步点;所述第...
- 徐卫志
- 文献传递
- 众核处理器片上同步方法和其系统
- 本发明涉及众核处理器片上同步方法和其系统,在片上众核体系结构中,使用专用的片上同步管理装置支持粗粒度同步方法,由于访问片上同步管理装置的时间远远小于访问内存的时间,而且避免了因为轮询标志位造成的网络拥塞,因此减少了同步时...
- 徐卫志焦帅张浩刘志勇范东睿雷峥蒙宋风龙王达
- VMM中Guest OS非陷入系统调用指令截获与识别被引量:6
- 2014年
- 针对虚拟化环境下Guest OS某些特定指令行为不会产生陷入从而在虚拟机管理器(virtual machine monitor,VMM)中无法对其进行监控处理的问题,提出通过改变非陷入指令正常运行条件,使其执行非法产生系统异常陷入VMM的思想;据此就x86架构下Guest OS中3种非陷入系统调用指令在VMM中的截获与识别进行研究:其中基于int和sysenter指令的系统调用通过使其产生通用保护(general protection,GP)错系统异常而陷入,基于syscall指令的系统调用则通过使其产生UD(undefined)未定义指令系统异常而陷入,之后VMM依据虚拟处理器上下文现场信息对其进行识别;基于Qemu&Kvm实现的原型系统表明:上述方法能成功截获并识别出Guest OS中所有3种系统调用行为,正常情况下其性能开销也在可接受的范围之内,如在unixbench的shell测试用例中,其性能开销比在1.900~2.608之间.与现有方法相比,它们都是以体系结构自身规范为基础,因此具有无需修改Guest OS、跨平台透明的优势.
- 熊海泉刘志勇徐卫志唐士斌范东睿
- 关键词:客户操作系统虚拟机管理器虚拟化