窦勇
- 作品数:217 被引量:350H指数:10
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术电子电信文化科学生物学更多>>
- 基于FPGA的列选主元LU分解方法
- 本发明公开了一种基于FPGA的列选主元LU分解方法,要解决的技术问题是降低LU分解的时间复杂度,加快稠密矩阵线性方程组的求解。技术方案是首先构建基于FPGA的由主处理单元和P个从处理单元组成的主从式并行计算系统,由主从式...
- 邬贵明窦勇夏飞姜晶菲周杰
- 文献传递
- 一种基于混淆矩阵的多分类任务准确率评估新方法被引量:29
- 2021年
- 多分类任务准确率评估对评判模型的分类效果具有重要的理论意义和应用价值。针对机器学习领域的多分类任务,在现有方法的基础上,通过拓展和迁移应用,给出一种新的评估方法。为了准确评估多分类任务模型的分类效果,将遥感图像分类效果评估方法引入多分类任务。针对多分类任务的实际特点,对该方法进行了改进与推广,以更好地评估分类器效能。基于MNIST手写字符集识别任务和CIFAR-10数据集分类任务的实验结果表明,同样是基于混淆矩阵进行计算,与现有的评估方法相比,该方法可以同时给出分类器整体的分类效果和单个类别的分类效果,对于改进训练过程有一定的指导意义。另一方面,该方法可以推广到任意的分类任务分类效果评估工作中,具有较好的应用前景。
- 张开放苏华友窦勇
- 关键词:混淆矩阵
- Open Divx视频编码程序的并行性分析与优化研究
- 2003年
- Open Divx是一种基于MPEG-4思想开发的视频压缩软件。为了解决嵌入式条件下视频数据的实时压缩问题,本文对Open Divx视频编码程序进行了循环级并行性和指令级并行性的分析。最后,我们得出了Open Divx视频编码程序更适合于在采用多整数运算功能部件的体系结构环境下运行的结论。
- 陈建文谢松窦勇
- 关键词:并行性分析视频处理MPEG-4视频对象
- 基于卷积-自动编码机的三维形状特征学习被引量:14
- 2015年
- 三维形状特征在三维物体分类、检索和语义分析中起着关键的作用.传统的三维特征设计过程繁复,而且不能从已有的大量三维数据中自动学习而得.在深度神经网络的研究领域中,卷积神经网络和自动编码机是比较流行的2种网络结构.在超限学习机的框架之下,将两者结合起来,提出一种基于卷积-自动编码机的三维特征自动学习方法.实验结果表明,文中方法的特征学习速度比其他深度学习方法提高约2个数量级,且提取的特征在三维模型分类、三维物体检测等任务中都取得了良好的结果.
- 谢智歌王岳青窦勇熊岳山
- 关键词:卷积神经网络
- 基于FPGA 的蛋白质二级结构预测算法加速器研究
- 蛋白质二级结构预测领域,基于FPGA 平台设计了一种细粒度的GOR 算法加速器,采用多端口并行查询策略同时获取当前中心残基计算窗口中的所有信息值;使用流水线的计算方式有效提高了并行效率。在单片FPGA 上的实验结果表明,...
- 雷国庆夏飞窦勇
- 关键词:BIOINFORMATICSSECONDARYFINE-GRAINEDPARALLELISMACCELERATOR
- 人脸合成图像的检测方法及装置
- 本发明公开了一种人脸合成图像的检测方法及装置,包括:将待检测图像输入已训练的网络模型,以由网络模型中的人脸检测网络基于待检测图像获得包含人脸框的图像并输出给网络模型中的真伪判别网络;真伪判别网络基于包含人脸框的图像判别待...
- 乔鹏赵蕾窦勇姜晶菲李荣春牛新苏华友潘衡岳
- 目标检测网络构建方法及装置、目标检测方法
- 本申请提供一种目标检测网络构建方法及装置、一种目标检测方法及装置、一种电子设备以及一种计算机可读介质。目标检测网络构建方法包括:获取用于目标检测的初始网络模型,所述初始网络模型包括相连的骨干网络和多任务学习模块;在所述多...
- 李荣春刘运韬窦勇姜晶菲牛新苏华友乔鹏潘衡岳周鑫张俊杰
- 文献传递
- 基于FPGA的带回溯的Smith-Waterman算法加速器的设计与实现被引量:1
- 2009年
- 针对传统的Smith-Waterman硬件算法加速器未保存回溯路径而无法回溯的问题,通过将计算路径存入外存,在FPGA平台上基于脉动阵列实现了带回溯的Smith-Waterman算法加速器,详细阐述了算法加速器回溯设计中的关键技术以及算法加速器的系统结构。实验表明,与传统的解决方案相比,带回溯的算法加速器最高可获得161倍加速比,能够有效提高带回溯的Smith-Waterman算法执行效率。
- 邹丹窦勇夏飞倪时策
- 关键词:FPGASMITH-WATERMAN算法脉动阵列
- 一种基于SUIF2的C程序循环特征分析工具的设计与实现
- 本文首先分析了程序特征分析的必要性和当前研究现状;然后介绍了SUIF2系统,并提出了一种基于SUIF2系统进行程序特征分析工具开发的新方法;接着详细分析了该工具的系统结构、实现原理、主要功能和实现方法;最后用SPEC20...
- 陈桂茸窦勇徐炜遐
- 关键词:接口可扩展性
- 文献传递
- 基于FPGA的高精度科学计算加速器研究被引量:10
- 2012年
- 探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QP-MAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗.
- 雷元武窦勇郭松
- 关键词:LU分解FPGA硬件加速器