国家自然科学基金(61136002) 作品数:170 被引量:514 H指数:11 相关作者: 吴成茂 韩俊刚 李涛 杜慧敏 田小平 更多>> 相关机构: 西安邮电大学 西安电子科技大学 西安微电子技术研究所 更多>> 发文基金: 国家自然科学基金 陕西省自然科学基金 陕西省教育厅科研计划项目 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 冶金工程 更多>>
基于PAAG系统的编译器移植技术设计与实现 被引量:1 2015年 针对西安邮电大学自主设计的一款面向图形、图像应用的阵列处理器PAAG系统(polymorphic array architecture for graphics and image processing)多核处理器并行编译问题,提出一种基于GCC编译器框架的可实现并行编译的移植技术。结合图像处理器并行处理要求和硬件特点,通过一种底层中间表示——寄存器传输语言RTL(register transfer language)进行模式匹配,完成指令选择,实现编译器移植;使用堆栈管理方式解决PAAG系统没有寄存器文件的问题和函数调用问题。该技术的实现打破了PAAG系统只能手工编译的局面,有效提高了单个处理器的编译效率,使PAAG系统的性能得到提升;对于并行处理的图形图像处理器,该技术是一种正确可行的实施方案。 张薇薇 王亚刚关键词:并行处理 函数调用 一种新型自动向量化编译算法 2016年 SIMD(single instruction multiple data)体系结构在高性能计算与嵌入式多媒体计算中扮演着重要的角色,对于SIMD指令的自动向量化编译技术是当前编译领域的研究热点.本文基于超字并行(super-word level parallelism,SLP)算法提出了一种新的自动向量化算法GSLP(global super-word level parallelism),该算法分为两部分:语句分组和语句调度.语句分组从全局出发分析超字复用信息,在语句分组的过程中,充分挖掘基本块的直接或者间接的超字复用信息,提高基本块内语句并行操作的机会;语句调度对基本块内的所有语句进行调度并调整超字内部单字(Single-word)数据的组织顺序,使生成的代码中打包/解包(pack/unpack)操作的数量降到最低.使用16个测试程序对GSLP算法进行测试,试验结果表明该算法使打包/解包操作的数量平均减少了41.6%,与SLP算法所产生的加速相比平均提高了4.7%. 吕鹏伟 刘从新 沈绪榜关键词:SIMD指令 自动向量化 基于SDSoC的SIFT特征点检测 2016年 为了在嵌入式机器视觉处理系统中能够快速提取图像的特征点,完成图像匹配与物体识别等操作,提出了一种在全可编程器件上实现的SIFT(Scale Invariant Feature Transform)算法。该算法使用SDSoC开发环境,采用PS(Processing System)和PL(Programmable Logic)协同开发策略,通过流水线优化、软硬件并行和重构算法顺序等方法对算法进行优化。对多幅QVGA分辨率图像进行了处理,结果表明软硬件协同开发的策略能够有效提高算法性能,同时能保留较多特征点。该算法生成的特征点在尺度变换、旋转和缩放的情况下均能得到良好的匹配效果。与现有使用软件实现的SIFT方案相比,具有一定的实时性,满足了在嵌入式领域的应用需求。 张波 韩俊刚关键词:SIFT 软硬件协同 FPGA 全文增补中 一种改进的高性能Lorenz系统构造及其应用 被引量:22 2015年 Lorenz系统是一种最具有代表性、典型性的混沌模型之一,一直被众多学者深入研究和广泛应用.为了获取结构和动力学行为更为复杂的混沌吸引子,不断改善Lorenz系统已成为混沌动力系统研究中的重要课题之一.为此,本文提出了一个具有复杂系统动力学行为的改进的Lorenz系统,并将其用于图像信息安全保护.在现有各种改进的Lorenz系统的基础上,首先通过增加Lorenz系统的控制参数和改变非线性项相结合的方法构造出一种新的Lorenz混沌系统;其次采用微分动力系统方法深入研究该系统并获得与Lorenz系统、Bao系统、Tee系统和Y系统等具有相似的耗散性、对称性、稳定性,以及更加复杂的混沌特性和动力学行为,同时分析该系统所产生随机序列具有良好的相关性和复杂性;最后将其所产生的离散伪随机序列用于图像置乱和扩散加密,通过对图像加密结果的相邻像素相关性分析、灰度空间相关特性不确定性分析、抗差分攻击以及密钥敏感性测试,表明本文所构造的改进的Lorenz系统应用于图像加密能获得相对较高的安全性. 官国荣 吴成茂 贾倩关键词:LORENZ系统 LYAPUNOV指数 图像加密 高速CMOS时钟数据恢复电路的设计与仿真 被引量:4 2014年 针对2.5Gb/s高速收发器采用SMIC 0.18μm CMOS工艺,设计了双环半速率时钟数据恢复电路,其中锁相环环路为时钟数据恢复电路提供16相1.25GHz、等相位间隔的参考时钟,CDR环路包括采用电流模式逻辑的前端1:2解复用电路、基于相位插值与选择的时钟恢复电路、可以消除亚稳态的超前滞后采样型鉴相器电路,以及基于精度可预置的"折半与顺序查找"相位选择算法的数字滤波器电路.采用SpectreVerilog进行数模混合仿真,结果表明电路可以正确处理2.5Gb/s差分输入数据,完成时钟恢复与数据重定时. 邓军勇 蒋林 曾泽沧关键词:时钟数据恢复 数字滤波器 高速收发器中解复用电路的设计 被引量:1 2014年 采用SMIC 0.18μm CMOS工艺,设计了高速收发器中双模1:8/1:10解复用电路。解复用电路采用半速率结构,基于电流模式逻辑完成对2.5 Gb/s差分数据1:2解复用电路;基于交替反相的锁存器和反馈逻辑完成双模4/5时钟分频和占空比调节;通过适当的相位控制实现了由相位控制链、交替存储链和同步输出链构成的1:4/1:5模式可选的数字CMOS解复用电路;1:2与1:4/1:5解复用级联完成1:8/1:10串并转换。采用数模混合仿真方法对电路进行仿真,结果表明该电路能可靠工作。 邓军勇 蒋林 曾泽沧关键词:解复用 CMOS 锁存器 后处理反走样技术综述 被引量:4 2016年 简述计算机图形学中走样现象产生的原因、常见的走样现象及延迟渲染技术。除介绍形态反走样、实用性形态反走样、子像素重建反走样等算法的背景、理论和研究现状外,重点讨论适用于延迟渲染技术的各种后处理反走样算法。通过对各种后处理反走样算法的分析,探寻各种后处理反走样技术的特点、应用场合和发展趋势。 杜慧敏 杜琴琴 季凯柏 蒋忭忭 郭冲宇关键词:计算机图形学 反走样 后处理 嵌入式GPU中二级高速缓存的设计与实现 被引量:2 2018年 针对嵌入式GPU与主存之间进行数据交互时出现速度不匹配的问题,设计了一种适用于嵌入式GPU的二级高速缓存Cache控制器.二级Cache控制器采用四路组相联的映射结构,使用伪最近最少使用(Pseudo_LRU)替换算法,可以管理16~512kB的二级高速缓存.实验结果表明,当选取Cache大小为128kB时,Cache的命中率达到71.12%. 杜慧敏 杨超群 季凯柏GCC编译器中的堆栈保护技术概述 被引量:5 2017年 以堆栈溢出为代表的缓冲区溢出已经成为最为普遍的安全漏洞之一。自从1988年缓冲区漏洞被发现以来,虽然经过几十年的努力,科研人员提出了各种防护方法,但是在操作系统或者软件当中总有新的溢出漏洞或者其变种被发现。为了尽可能避免堆栈溢出漏洞被攻击者利用,一直以来,众多的编译器工作者在GCC编译器中尝试了多种方法来保护内存中的堆栈区域。 曹耀彬 王亚刚关键词:堆栈 缓冲区溢出 时钟共享多线程处理器通信机制的设计与实现 被引量:2 2016年 多核多线程处理器^([1])是并行技术的一个发展方向,基于多核多线程处理器,提出了一种时钟共享多线程处理器。该处理器有近邻通信和线程间通信两种通信机制,近邻通信采用近邻共享FIFO来传递信息,线程间通信通过线程间共享存储来传递信息,这样可以提高处理器的资源利用率和并行执行能力。 雷晓锋 李涛