搜索到170篇“ CUDA架构“的相关文章
基于面向对象对CUDA架构的LBM计算程序优化
2024年
晶格玻尔兹曼方法(LBM)是一种新颖而有前途的计算流体力学方法,从算法的角度看,其迭代过程能被分化为多个子问题的并行程序,非常适合在高性能图像处理器(GPU)计算,获得极快的数据处理速度,同时有大量工作报告了基于GPU计算的LBM方法得到了高效实现。程序环境以C++编程语言,运用面向对象思想优化CUDA程序结构,可减少程序的耦合性,赋予程序的可持续发展能力;使用Poiseuille flow模型验证优化程序的稳定性与准确性。在程序运行过程中,调用CUDA内核函数来处理模型内的碰撞、迁徙流动、计算宏观量的迭代过程,同时使用共享内存储存GPU运行时的数据,以提高计算效率。数据分析结果表明,计算速度较中央处理器(CPU)提升了70倍,这归功于GPU高性能的并行计算能力。
韦华健张乾毅张静静李华兵
关键词:面向对象CUDA
基于CUDA架构的工业锥束CT三维重建方法及系统
本发明提供了基于CUDA架构的工业锥束CT三维重建方法及系统,方法包括在CUDA架构上运行工业锥束CT三维重建方法。加权阶段,利用二维加权模板,对每个角度下的二维投影数据并行加权;滤波阶段,对每张加权后的投影数据按行重排...
王朕王占张磊高顺起王丽娟李玉芝卫嘉暄
基于CUDA架构的工业锥束CT三维重建方法及系统
本发明提供了基于CUDA架构的工业锥束CT三维重建方法及系统,方法包括在CUDA架构上运行工业锥束CT三维重建方法。加权阶段,利用二维加权模板,对每个角度下的二维投影数据并行加权;滤波阶段,对每张加权后的投影数据按行重排...
王朕王占张磊高顺起王丽娟李玉芝卫嘉暄
CUDA架构中的线程块处理系统、方法及相关设备
本申请提供了一种CUDA架构中的线程块处理系统、方法及相关设备,其中,该系统包括线程索引配置器、多个处理单元PE和每个PE对应的线程索引选择器;线程索引配置器,配置为根据待处理数据的第一维度信息和设定的普通线程块的第二维...
雷宇李原朱建斌付尧
一种基于CUDA架构的GPU并行加速实时超分辨重构方法
本发明公开一种基于CUDA架构的GPU并行加速实时超分辨重构方法,在超分辨重构算法中引入CUDA架构模型,将超分辨重构算法通过GPU并行计算模式进行加速以达到实时重构的速度;利用CPU与GPU异构模式,可以使得CPU与G...
匡翠方张金风陈友华刘旭
基于新型相关函数约束的CUDA架构并行优化立体变形测量方法
本发明公开了一种基于新型相关函数约束的CUDA架构并行优化立体变形测量方法,包括:获得多相机间的相对位姿参数关系;基于相机间的联合约束关系建立散斑立体配准的新型相关函数,所述新型相关函数将图像对间立体配准点的搜索限制在对...
张贵阳刘琪吉思雨朱子健王靖周婞王绵绵
基于CUDA架构的雷达信号分选算法研究
雷达设备的大量应用,使得雷达侦察设备面临的电磁威胁环境信号密度达到数百万个数量级,对雷达信号分选的准确性、可靠性和实时性提出了更高的要求。本文借鉴机器学习算法,在雷达信号多参数特征样本下学习训练,使其在复杂环境下的分选准...
张傲
关键词:雷达信号分选CUDA架构
一种CUDA架构D8算法的水域流向和累积汇流量并行分析方法
本发明提供一种CUDA架构D8算法的水域流向和累积汇流量并行分析方法,包括:基于GPU纹理存储器构建流域DEM栅格数据的读取存储模型;基于GPU全局存储器,设置并行网格和线程块,映射线程到DEM栅格单元,获取当前线程身份...
白桦刘址杰桂发亮李二辉康传雄吴绍飞
基于CUDA架构下的直方图均衡并行算法
2021年
为了提高图像对比度,解决传统的直方图均衡算法处理速度慢的问题,提出了基于统一计算设备架构(CUDA)的直方图均衡图像实时处理加速方案。利用图形处理器(GPU)强大的计算能力和CUDA优化的存储器结构,以加速直方图均衡中的图像灰度级投票、分布概率累加并映射以及图像新的灰度值填充等功能进行运算。在CUDA条件下,对直方图均衡算法进行串-并行分析,分别从粗粒度与细粒度角度进行并行设计,通过实验测定进行了设计参数寻优,获得了线程块设计参数的最优尺寸。结果表明,基于CUDA的图像直方图均衡并行算法的性能相比基于CPU的串行算法和基于开放多处理(OpenMP)并行算法分别获得了61.58和32.00倍的加速比,能够为大规模实时性图像处理系统设计提供参考。
肖汉肖诗洋孙陆鹏郭宝云
关键词:直方图均衡图像增强图形处理器统一计算设备架构
基于CUDA架构并行算法的带地形AMT二维反演实现与应用被引量:2
2021年
并行计算是提高音频大地电磁(audio-frequency magnetotelluric,AMT)数据反演效率的有效途径。在统一计算设备架构(compute unified device architecture,CUDA)下开展带地形的AMT数据二维反演并行算法研究,旨在利用GPU(graphics processing unit)强大的计算能力及并行计算技术实现高精度、快速度的AMT数据二维反演。首先利用有限元和自适应正则化反演算法实现AMT数据二维反演的串行化计算;然后在PGI Visual Fortran+CUDA5.5环境下编写基于CPU+GPU的CUDA并行代码,将正演中的频率循环、反演中的模型灵敏度矩阵计算和反演方程正则化求解部分进行并行化处理;通过不同复杂程度的理论模型正反演模拟验证了该并行算法的有效性和准确性。不同模型和不同模式下的数值模拟结果对比表明,基于CPU+GPU的CUDA并行算法相较于传统的CPU串行算法,在灵敏度矩阵计算和反演方程正则化方面耗时更少,加速比最高可达10倍以上。最后将该并行算法应用于某矿区实测AMT数据的二维反演中,取得了较好的应用效果。
韩思旭陈小斌陈卫营罗强宋婉婷
关键词:音频大地电磁法二维反演统一计算设备架构加速比

相关作者

宋亚鹏
作品数:3被引量:0H指数:0
供职机构:西安电子科技大学
研究主题:CUDA架构 并行化 CT图像重建 滤波模块 异步并行
何国经
作品数:65被引量:118H指数:5
供职机构:西安电子科技大学
研究主题:红外成像系统 图像 基于FPGA 精确制导 目标识别与跟踪
田捷
作品数:909被引量:3,072H指数:30
供职机构:中国科学院自动化研究所
研究主题:断层成像 成像 分子影像 图像 成像系统
冉超
作品数:4被引量:0H指数:0
供职机构:西安电子科技大学
研究主题:并行化 CUDA架构 CT图像重建 血管新生 血管
宋万杰
作品数:88被引量:181H指数:8
供职机构:西安电子科技大学
研究主题:FPGA 多普勒 脉冲压缩 雷达 基于FPGA