国家自然科学基金(60676010) 作品数:17 被引量:42 H指数:4 相关作者: 彭元喜 尹亚明 朱红雷 陈胜刚 陈书明 更多>> 相关机构: 国防科学技术大学 兰州大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 长江学者和创新团队发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 机械工程 更多>>
一种面向应用的NOC缓冲区分配算法 被引量:6 2009年 片上互连网络是片上通信问题的有效解决方案,但其存在严重的资源限制。输入缓冲区占据片上网络总面积的显著部分,同时其容量大小对不同应用映射后获得的性能有重要影响。给出一种面向应用数据负载的NOC缓冲区分配算法,针对不同的应用映射,该算法可以根据数据流量分布特征实现各个路由器输入通道上缓冲区资源的定制分配。实验结果表明,使用该算法后,系统缓冲区资源得到了更有效的利用。与均匀分配缓冲区的NOC系统相比,采用该算法实现的缓冲区分配方案使系统在保持性能变化不大的情况下,能够节省约50%的缓冲区总容量。 尹亚明 陈书明 孙书为 王耀华关键词:片上网络 一种动态分配输入队列的片上虫孔路由器结构 被引量:5 2010年 为了降低片上网络(NoC)由于虫孔缓冲结构排头(HoL)阻塞导致的性能损失,同时消除虚通道缓冲结构对可变长度报文表现出的缓冲区低利用率现象,本文采用虚拟通道技术提出一种动态分配输入队列(DAIQ)的片上虫孔路由器结构.该结构采用一种令牌表的方式支持虚拟队列深度与数量的动态分配,同时为了支持同一报文微片能够连续调度,本文还提出一种新颖的开关分配机制——SRRM,该机制在高负载下进一步改善了开关的延迟与吞吐率.仿真与综合的结果表明,相比传统虚通道流控的片上路由器结构,DAIQ路由器以50%的缓冲面积获得类似的性能,在0.13微米CMOS工艺下节约了30.18%的标准单元面积与38.4%的功耗. 朱红雷 彭元喜 陈海燕 尹亚明关键词:片上网络 流控 A radiation-hardened-by-design technique for improving single-event transient tolerance of charge pumps in PLLs 被引量:2 2009年 A radiation-hardened-by-design (RHBD) technique for phase-locked loops (PLLs) has been developed for single-event transient (SET) mitigation. By presenting a novel SET-resistant complementary current limiter (CCL) and implementing it between the charge pump (CP) and the loop filter (LPF), the PLL's single-event susceptibility is significantly decreased in the presence of SETs in CPs, whereas it has little impact on the loop parameters in the absence of SETs in CPs. Transistor-level simulation results show that the CCL circuit can significantly reduce the voltage perturbation on the input of the voltage-controlled oscillator (VCO) by up to 93.1% and reduce the recovery time of the PLL by up to 79.0%. Moreover, the CCL circuit can also accelerate the PLL recovery procedure from loss of lock due to phase or frequency shift, as well as a single-event strike. 赵振宇 张民选 陈书明 陈吉华 李俊丰加法器溢出处理的优化设计与实现 2011年 本文提出了一种带溢出处理功能的加法与分支模块的新结构。这种结构无需等待特定的溢出判断信号,从而减少了溢出处理的延时开销。本文主要针对关键路径上控制信号的竞争问题,提出了两种解决方案。基于数学的角度重新分析各控制信号与数据输入之间的关系,把较早到达的0或1提前参与运算。而把较晚到达的0或1推迟参与运算,利用前一级运算的时间生成晚到的控制信号,成功地解决了关键路径上控制信号的竞争问题。此设计在0.13μmCMOS工艺中实现,版图后仿真最大延时为590ps,较之前结构减少了210ps,达到预期优化目的,实现了时序收敛,有效地提高了加法器的运算效率。 吴虎成 刘凯峰 李振涛关键词:加法器 面向STM的松弛存储一致性算法 2010年 软件事务性内存(STM)提供同步手段,让多线程程序高效并发执行。如果两个事务访问了同一个共享数据且至少一个事务进行了修改操作,则称发生了冲突。检测冲突后,一般选择一个事务终止。当前的STM实现都基于严格的线性一致性(Linearizability)语义模型,实现简单。但是,基于该语义会导致很多本来可以完成提交的事务失败,降低了系统效率。把因果一致性模型应用于STM,可以在保证程序准确性条件下取得较好的实际性能。实验数据表明,该算法简单高效,明显减少了冲突数目。 张小强 彭林 黄春 谢伦国关键词:并发 多线程 PTCDA表面射频磁控溅射ITO薄膜的特性研究 被引量:1 2007年 将氧化铟锡(ITO)溅射淀积在PTCDA/玻璃衬底表面,利用原子力显微镜(AFM)、四探针和紫外可见分光光度计分别测量薄膜的表面形貌、电阻率和透光率。结果表明衬底温度对ITO在PTCDA上的淀积有着与在其他衬底上淀积所不同的影响,提高衬底温度淀积ITO并没有提高薄膜的结晶度;溅射功率的提高有利于ITO电阻率的下降,但是功率过高会破坏ITO薄膜的特性ITO膜厚度的增加导致其电阻率减小。 孙硕 胥超 冯煜东 肖剑 张福甲关键词:PTCDA 透光率 流处理器中支持非规格化浮点数的硬件实现 2007年 IEEE754标准规定了浮点非规格化数的处理,但这种数据类型计算非常复杂以至于很多设计采用软件而不是硬件的方式来处理非规格化数.软件方法会增加数据处理时间,在流处理器中,为了提高数据处理效率没有设置中断/自陷机制,不能采用软件方法来处理非规格化数据,为此,提出一种硬件识别和处理非规格化数的方法,在融合乘加部件架构基础上只增加少量额外的硬件代价,就可以对浮点非规格化数进行处理,这种方法大大提高了非规格化数据的处理速度. 李勇 方粮关键词:IEEE754标准 片上网络流量模型的研究与实现 2011年 分析了三种具有代表性的流量模型:均匀分布、泊松分布、自相似流量模型,并实现了基于这些模型的流量生成器.模拟结果与预期结果符合,目前流量生成器已经应用到实际模拟平台之中. 彭元喜 陈诚关键词:片上网络 Amdahl定律在层次化片上多核处理器中的扩展 被引量:7 2012年 层次化片上多核处理器以紧耦合的多个核构成超节点,对访存和片上通信的局部性有良好支撑,能有效地缓解片上多核中数据通信带来的通信开销.在关于多核处理器的Amdahl开销/性能模型已有的研究基础上,引入片上数据通信延迟作为Amdahl任务计算开销的新元素,构建了层次化片上多核处理器的Amdahl加速比扩展模型.基于该扩展模型,就层次化片上多核处理器的加速比与超节点配置的关系问题展开研究.模拟分析发现,要获得良好的加速比性能,层次化片上多核处理器需要在超节点数目与超节点的大小(超节点内核的个数)之间作仔细的权衡;对于给定核数目的层次化片上多核处理器,使系统性能最优的超节点大小往往出现在中间某个值而不是最大或者最小,并且该值随着系统规模的变化会发生相应的变化. 陈书明 陈胜刚 尹亚明关键词:层次化结构 片上多核处理器 数据通信 AMDAHL定律 X-DSP ALU与移位部件的设计与实现 被引量:1 2010年 针对DSP CPU的算术运算逻辑单元(ALU)与移位部件在性能、功耗与面积上面临的挑战,研究了X型DSP的CPU体系结构,在对X型DSP ALU部件和移位器部件相关指令进行归类分析的基础上,设计实现了ALU部件和移位器部件。采用Design Compiler综合工具,基于SMIC公司0.13μm CMOS工艺库对ALU移位部件进行了逻辑综合,电路功耗共为4.2821 mW,电路面积为71042.9804μm2,工作频率达到250 MHz。 彭元喜 邹佳骏关键词:数字信号处理器