您的位置: 专家智库 > >

梁博

作品数:7 被引量:22H指数:3
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金安徽省自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术医药卫生更多>>

文献类型

  • 5篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 6篇自动化与计算...
  • 1篇医药卫生

主题

  • 5篇处理器
  • 2篇多核
  • 2篇多线程
  • 2篇软件模型
  • 2篇同时多线程
  • 2篇线程
  • 2篇模拟器
  • 2篇处理器模拟器
  • 1篇单芯片多处理...
  • 1篇多处理器
  • 1篇多核处理
  • 1篇多核处理器
  • 1篇多核结构
  • 1篇多线程处理
  • 1篇多线程处理器
  • 1篇性能评价
  • 1篇影像
  • 1篇影像学
  • 1篇影像学方法
  • 1篇硬件开销

机构

  • 7篇中国科学技术...
  • 2篇中国科学院
  • 1篇郑州市第五人...

作者

  • 7篇梁博
  • 5篇安虹
  • 2篇任建
  • 2篇路放
  • 1篇王耀彬
  • 1篇王莉
  • 1篇何裕南
  • 1篇苏航
  • 1篇史念曾
  • 1篇郭锐

传媒

  • 3篇计算机科学
  • 1篇中原医刊
  • 1篇小型微型计算...
  • 1篇2004年全...

年份

  • 1篇2009
  • 3篇2007
  • 2篇2006
  • 1篇2004
7 条 记 录,以下是 1-7
排序方式:
OpenSMT:一个同时多线程处理器模拟器的设计和实现被引量:4
2006年
同时多线程(SMT)技术是目前微处理器体系结构的研究热点之一。为了支持对 SMT 技术和基于 SMT 核的单芯片多处理器(CMP)体系结构技术的深入研究,我们在广泛使用的超标体系结构模拟器 SimpkScalar 的基础上.通过对 SMT 结构的关键特性进行适当的抽象,开发了一个 SMT 体系结构模拟器 OpenSMT。本文介绍了该模拟器主要的设计思想和实现方法,包括多个线程上下文结构的表示、超标量流水线各个阶段的模拟,以及模拟器设计和实现时需要解决的几个关键问题等。初步的应用研究表明,与现有可免费获得的研究用 SMT 模拟器相比,该模拟器能够较好地平衡模拟性能、灵活性和精度三个基本设计目标.实现了执行驱动、易于扩展指令集结构、艮好的用户接口、灵活的软件结构、适宜评估更广泛的 SMT、体系结构设计空间等设计要求。
路放安虹梁博任建
关键词:处理器模拟器同时多线程软件模型性能评价
同时多线程处理器上的动态分支预测器设计方案研究被引量:1
2006年
同时多线程处理器(SMT)每个周期能够从多个线程中发射指令执行,从而大大地提高了超标量微处理器的指令吞吐量,但多个线程的同时执行也带来了许多硬件资源的共享冲突问题。其中,多个线程共享分支预测硬件的方案会对分支预测精度产生较大的影响。研究 SMT 处理器中分支处理方案对于处理器整体性能的影响,对于指导SMT 处理器的设计是十分重要的。本文利用 SMT 处理器模拟器,针对各线程运行独立应用的 SMT 结构实验评估了几种著名的分支预测方案;给出了在单线程和多线程情况下,分支预测方案对分支预测精度和处理器整体性能的影响的分析;总结出在这样的 SMT 结构中,各线程拥有独立的预测器是一种较好的选择,并且由于各独立预测器可以采用小而简单的结构,所以不会带来太多的硬件开销。
任建安虹路放梁博
关键词:同时多线程处理器硬件开销
多核结构上的线程级推测关键技术研究
进入21世纪以来,随着半导体工艺技术的发展,微处理器芯片体系结构由于受到功耗与设计复杂度等问题的限制开始进入多核时代,但是传统的串行程序模型与串行地址空间模型并没有发生实质性变化,并行的多核结构模型与串行的计算理论模型之...
梁博
关键词:多核结构程序模型串行程序数据通信微处理器芯片
文献传递
下一代网络处理器微体系结构特征的模拟分析
通过对新近提出的包含有更多控制平面信息的NpBench的模拟分析,研究了下一代网络处理器的工作负载特征.文章从数据平面和控制平面两个方面研究了下一代网络处理器工作负载在每个包指令数(IPP)、指令分布、指令级并行性、分支...
梁博安虹任建路放
关键词:网络处理器微体系结构下一代网络
文献传递
超声定标法衰减定量分析的实验研究被引量:2
2007年
超声检查肝脏是临床应用最常见的影像学方法之一。尤其对均匀性脂肪肝衰减图像更有其前段回声亮密后段减弱之特征,虽然为临床诊断脂肪肝提供了重要的依据,但受超声仪器前后处理因素的影响使诊断结果重复性差,故不能将肝脏衰减进行量化分析达到定量诊断。针对这一问题我们研究了一种以定标体模模块作为基准的参照物,对超声图像进行对比分析的回声衰减定量分析技术,具有高度的重复性,现将实验研究报道如下。
史念曾苏航梁博
关键词:超声检查均匀性脂肪肝超声图像影像学方法
OpenCMP:一个支持事务存储模型的多核处理器模拟器被引量:9
2007年
CPU设计正在由仅开发指令级并行性的单线程单核结构转向利用线程级并行性的多线程多核结构,但至今还没有一个可移植性好并被广泛使用的开源多核处理器模拟器,限制了在这样的结构上开展高质量的研究工作。我们开发了一个多核处理器体系结构模拟器OpenCMP,用于支持当前和未来对多线程多核处理器体系结构关键技术的研究。该模拟器适当地抽象了多核处理器结构,为主流的多核处理器结构研究提供一个可扩展、灵活的模拟工具框架,包括支持对乱序、顺序的处理器核和同时多线程处理器核的模拟,以便对更大的多核设计空间进行比较性研究。本文以支持事务存储模型的多核处理器结构模拟器为例,详细描述了如何通过抽象多核结构和事务存储模型的最基本特性和组成部分,扩展单核处理器模拟器SimpleScalar,设计与实现一个多核处理器模拟器。初步研究表明,与现有的多核处理器模拟器相比,该模拟器能够较好地支持对事务存储模型和基于事务存储模型的多核处理器体系结构的研究。
何裕南安虹郭锐梁博
关键词:处理器模拟器单芯片多处理器软件模型
针对子程序结构的线程级推测并行性分析被引量:7
2009年
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的.
梁博安虹王莉王耀彬
共1页<1>
聚类工具0