“核心电子器件、高端通用芯片及基础软件产品”国家科技重大专项(2009ZX01034-001-001-002)
- 作品数:12 被引量:16H指数:3
- 相关作者:郑启龙洪兴勇陈思灵洪一付和萍更多>>
- 相关机构:中国科学技术大学合肥工业大学安徽省高性能计算重点实验室更多>>
- 发文基金:国家科技重大专项安徽省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于编译制导的复数乘法优化设计被引量:1
- 2012年
- 数字信号处理芯片不能充分利用其自身提供的复数乘法指令,会造成复数乘法运算性能低下。为此,提出一种基于编译制导的复数乘法优化模块。采用传递编译制导命令,使得编译器在指令控制块中,能运用识别算法识别出与复数乘法运算相关的所有指令,并替换其中的乘法指令为单条复数乘法指令。实验结果表明,该优化模块能缩短fft_radix2和fft_radix4程序的执行时钟周期。
- 付和萍郑启龙陈思灵冯玉谦
- 关键词:数字信号处理复数乘法控制块
- 视场外激光干扰图像对目标获取性能的影响分析被引量:4
- 2012年
- 以现有的目标获取性能模型NVLESD(Night Vision and Electronic Sensors Directorate)为基础,分析杂波对于"人在回路"目标获取性能的影响。针对视场外激光干扰图像的特点,运用图像边缘概率尺度修正后的目标获取性能模型对激光干扰图像进行分析。对CCD探测器的视场外干扰实验结果表明,该方法能够较好地反映激光干扰图像对于搜索探测概率的影响,从而验证了方法的有效性。
- 洪兴勇洪一徐银胡国华
- 关键词:激光干扰杂波
- DSP编译器中一种基于子图的分簇算法被引量:1
- 2010年
- 为了提高发射宽度,高端DSP普遍采用分簇结构设计.分簇结构的处理器依赖编译器在代码生成的时候指定每条指令所在的簇.针对传统分簇算法中存在参考信息太过局部的问题,提出一种依据资源压力将指令依赖图划分成多个子图,然后对子图进行分簇的算法.最后,验证了该算法能够提高分簇效率.
- 郑启龙汪胜夏霏
- 关键词:数字信号处理器分簇编译器依赖图
- 支持SIMD与簇间双字传输体系下的VLIW DSP分簇算法
- 2012年
- VLIW DSP通过软件流水获得时间并行性,通过指令分簇获得空间并行性.指令的分簇本质上是资源分配问题.传统的指令分簇假设一条指令分到某一簇执行,而某些体系结构提供SIMD指令,传统的分簇算法对这类体系结构并不完全适用.提出的基于评估模型的分簇算法能对SIMD指令和普通指令进行合理的分簇.分簇之后,通过调度簇间传输指令,合成适当的簇间双字传输指令.由于SIMD和簇间双字传输的引入,以及较好的分簇决策,程序整体的调度延迟变短.对许多数字信号处理程序相对于没分簇的情况下的性能有2~3倍的性能提升,相对寄存器压力分簇算法有约7~10%性能的提升.
- 陈思灵郑启龙冯玉谦付和萍
- 关键词:调度延迟数据流图
- DSP分块内存和多AGU的编译指示优化被引量:3
- 2012年
- 分块内存和多地址生成器(AGU)是DSP普遍采用的体系结构.传统的C语言编译器没有针对分块内存和多AGU结构进行代码优化,导致生成代码无法满足性能需求,影响了C语言编译器在数字信号处理领域的应用.为了解决这个问题,提出基于编译指示,与分块内存和多AGU结构相关的编译优化算法.该算法利用定义引用链和引用定义链中的数据流信息,为地址计算指令和访存指令分配AGU,从而提高生成代码的指令级并行度.实验结果表明此算法能够达到较好的优化效果.
- 郑启龙卢世贤洪兴勇陈元夏霏
- 关键词:DSP
- 推测执行技术在HPMR系统通信优化中的应用被引量:2
- 2010年
- HPMR(high performance MapReduce)系统是一个采用MapReduce模型的高性能计算软件支撑平台.在进行高性能计算时,HPMR往往需要很多轮Map-Reduce过程,中间的通信过程由KV路由和KV传输组成.KV传输依照KV路由阶段产生的KV路由表进行.HPMR程序的典型通信特征是每一轮的KV传输以高概率使用上一轮的KV路由表.根据这一特点,提出在HPMR的通信模型中引入推测执行技术,由此减少了KV路由的次数,使得HPMR的通信性能得到大大地提升.
- 王昊王向前郑启龙
- 关键词:MAPREDUCE
- 基于IMPACT的嵌入式汇编设计与实现被引量:1
- 2012年
- DSP的底层特性与传统的C语言特性差别很大,有DSP领域的特殊指令集,这些指令很难被编译器生成,或者根本不能被编译器生成.程序员也有需求直接访问底层特性.为了解决这个问题,通过对IMPACT的基础编译器框架进行拓展实现嵌入式汇编功能模块.
- 冯玉谦郑启龙卢世贤陈思灵付和萍
- 关键词:DSP编译器IMPACT
- DSP编译器中一种基于子图的分簇算法
- 为了提高发射宽度,高端DSP普遍采用分簇结构设计.分簇结构的处理器依赖编译器在代码生成的时候指定每条指令所在的簇.针对传统分簇算法中存在参考信息太过局部的问题,提出一种依据资源压力将指令依赖图划分成多个子图,然后对子图进...
- 郑启龙汪胜夏霏
- 关键词:数字信号处理器分簇编译器依赖图
- 文献传递
- 脉冲雷达回波信号检测性能比较分析被引量:1
- 2013年
- 雷达脉冲回波信号在传播过程中受杂波、噪声和接收机检测电路的影响,呈现非平稳时变特点。本文针对脉冲回波信号检测的特点,研究了采用固定门限的N-P准则检测技术和门限自适应调整的CA-CFAR检测技术。分析比较了不同虚警概率下基于N-P准则的目标回波检测和在含噪声与杂波条件下设置不同的参考窗n进行CA-CFAR准则目标回波检测的性能,并开展了回波信号的检测性能比较。结果表明,CA-CFAR检测技术的性能优于N-P准则,且能够适应环境变化自适应调整检测门限。
- 洪兴勇洪一李文谨胡国华
- 关键词:N-P准则雷达脉冲信号
- 高性能BWDSP处理器指令代码压缩技术研究
- 2013年
- DSP处理器的功能日益强大,软件程序的复杂程度也在不断增大,软件的代码量迅速增加。采用LZW字典压缩对由源程序指令代码经过编译、汇编后生成的二进制机器代码进行压缩,可减少指令代码存储空间大小,这样在BWDSP处理器存储空间有限的条件下可以存储更多指令程序代码,同时增加Cache命中率,提高BWDSP处理整体性能。BWDSP处理器指令Cache代码压缩系统以指令Cache块为压缩单元。在高性能BWDSP处理器平台上对典型雷达信号程序代码压缩进行仿真实验,得出平均代码压缩率为60%左右。
- 洪兴勇洪一李文谨江志雄
- 关键词:代码压缩指令CACHELZW