付和萍
- 作品数:6 被引量:6H指数:1
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家科技重大专项安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 支持SIMD与簇间双字传输体系下的VLIW DSP分簇算法
- 2012年
- VLIW DSP通过软件流水获得时间并行性,通过指令分簇获得空间并行性.指令的分簇本质上是资源分配问题.传统的指令分簇假设一条指令分到某一簇执行,而某些体系结构提供SIMD指令,传统的分簇算法对这类体系结构并不完全适用.提出的基于评估模型的分簇算法能对SIMD指令和普通指令进行合理的分簇.分簇之后,通过调度簇间传输指令,合成适当的簇间双字传输指令.由于SIMD和簇间双字传输的引入,以及较好的分簇决策,程序整体的调度延迟变短.对许多数字信号处理程序相对于没分簇的情况下的性能有2~3倍的性能提升,相对寄存器压力分簇算法有约7~10%性能的提升.
- 陈思灵郑启龙冯玉谦付和萍
- 关键词:调度延迟数据流图
- 针对多簇架构的软件流水调度框架设计与实现
- 2013年
- 介绍基于编译基础设施IMPACT实现针对BWDSP100多簇体系结构特点软件流水调度框架.该调度框架能充分发掘多簇体系架构的硬件资源,在DSP特性应用程序上能有较好性能提升.
- 冯玉谦郑启龙陈思灵付和萍
- 关键词:IMPACTDSP
- 基于编译制导的复数乘法优化设计被引量:1
- 2012年
- 数字信号处理芯片不能充分利用其自身提供的复数乘法指令,会造成复数乘法运算性能低下。为此,提出一种基于编译制导的复数乘法优化模块。采用传递编译制导命令,使得编译器在指令控制块中,能运用识别算法识别出与复数乘法运算相关的所有指令,并替换其中的乘法指令为单条复数乘法指令。实验结果表明,该优化模块能缩短fft_radix2和fft_radix4程序的执行时钟周期。
- 付和萍郑启龙陈思灵冯玉谦
- 关键词:数字信号处理复数乘法控制块
- 多簇超长指令字DSP复数运算的编译优化被引量:3
- 2015年
- 多簇超长指令字(VLIW)DSP提供了多种复数指令,而编译器不能直接利用这些复数指令来提升编译性能。特此提出一种针对复数运算的编译优化方法,通过将复数操作基本块中加载指令和存储指令前移后置操作使得复数运算操作汇聚成连续操作片寻找复数指令合成的机会。实验结果表明该优化方法能减少复数程序的时钟周期。
- 丁陈飞郑启龙徐华叶付和萍陈元
- 关键词:超长指令字
- 基于IMPACT的嵌入式汇编设计与实现被引量:1
- 2012年
- DSP的底层特性与传统的C语言特性差别很大,有DSP领域的特殊指令集,这些指令很难被编译器生成,或者根本不能被编译器生成.程序员也有需求直接访问底层特性.为了解决这个问题,通过对IMPACT的基础编译器框架进行拓展实现嵌入式汇编功能模块.
- 冯玉谦郑启龙卢世贤陈思灵付和萍
- 关键词:DSP编译器IMPACT
- 基于超长指令字的全局无环指令调度和复数乘法优化设计
- BWDSP100是一款采用了超长指令字体系结构(VLIW)以及单指令多数据流(SIMD)技术相结合的32bit浮点数字信号处理器(DSP)。它是由中国电子科技集团某研究所自主设计、自主研发,拥有完全自主知识产权。它是主要...
- 付和萍
- 关键词:超长指令字复数乘法优化设计语言编译器
- 文献传递