陈岩
- 作品数:10 被引量:16H指数:3
- 供职机构:西安电子科技大学电子工程学院天线与微波技术国家重点实验室更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 高阶矩量法的超级电磁计算研究被引量:1
- 2015年
- 矩量法是广泛使用的高精度电磁数值算法之一。在仿真复杂电磁问题时,该算法需要处理大型复数稠密矩阵方程,这导致其面临内存需求高、计算时间长的问题。与传统基函数相比,本文采用的高阶多项式基函数能够在保证计算精度的前提下大幅度降低未知量,进而降低矩阵阶数。在此基础上,本文设计了基于分块矩阵的高效并行策略,在国内超级计算机平台开展了并行高阶矩量法的超级电磁计算研究,大幅度提升了矩量法的仿真能力。在国产神威蓝光超级计算机上,以机载天线阵列的辐射特性计算为例,对并行规模高达30720 CPU核时的算法性能进行了评估,测试结果表明算法在并行规模扩大20倍以上时仍可获得50%以上的并行效率。在当前排名世界第一的天河2号超级计算机上,以飞机散射特性计算为例,对并行规模高达201600 CPU核时的算法性能进行了评估,测试结果表明算法在并行规模扩大约8倍时可获得50%以上的并行效率。数值仿真结果表明并行高阶矩量法可以在不同架构的超级计算机上高效完成复杂电大目标的精确电磁计算。
- 林中朝陈岩张玉赵勋旺
- 关键词:高阶矩量法
- 国产CPU平台中并行高阶矩量法研究被引量:9
- 2015年
- 将并行高阶矩量法在纯国产CPU平台中对电磁辐射与散射问题进行了仿真计算,并以散射问题为例,对算法的并行效率进行了测试.基于高阶多项式基函数的矩量法在保证计算精度的同时,可以大幅度降低传统RWG基函数矩量法产生的未知量.基于分块矩阵的高效并行策略进一步提高了矩量法的计算规模,并加速了仿真计算的过程.数值结果表明,采用的并行高阶矩量法程序,为在纯国产超级计算平台中解决复杂电磁仿真问题提供了一条有效的途径.
- 林中朝陈岩张玉江树刚赵勋旺吕兆峰
- 关键词:矩量法计算电磁学天线辐射
- 异构平台中并行矩量法的加速技术
- 本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用M...
- 陈岩张光辉林中朝张玉赵勋旺
- 关键词:矩量法异构平台GPU加速
- 文献传递
- 异构平台中并行矩量法的加速技术被引量:1
- 2014年
- 本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用MPI实现计算节点之间的通信,同时利用GPU加速矩阵更新过程。为了突破GPU显存对LU分解的矩阵规模的限制,本文进一步研究了"显存—内存"核外算法。为了优化算法性能,本文提出了基于"CUDA流"技术和"异步通信"技术的设计方案,实现了GPU通信与计算的重叠,有效隐藏了GPU通信时间,获到了明显的加速效果。
- 陈岩张光辉林中朝张玉赵勋旺
- 关键词:矩量法异构平台GPU加速
- 异构平台中并行矩量法的加速技术
- 本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用M...
- 陈岩张光辉林中朝张玉赵勋旺
- 关键词:矩量法异构平台GPU加速
- 文献传递
- 基于超级计算机的矩量法性能分析与优化被引量:1
- 2017年
- 复杂目标的精确电磁特性分析往往需要巨大的存储和极长的计算时间。针对这一问题,结合国内发展迅速的超级计算机系统,研究了具有精确高效仿真能力的高性能电磁算法——高阶矩量法。提出了单元预选法来消除矩阵并行填充过程中的无效计算,加速矩阵填充过程。提出了一种具有更少的通信次数和通信量的新型并行LU分解算法,加速矩阵方程求解过程。数值测试表明提出的矩阵并行填充算法和矩阵方程并行求解算法在超级计算机平台上都能获得较高的并行性能,大幅提高了矩量法的仿真能力。
- 陈岩林中朝张玉
- 关键词:高阶矩量法超级计算机高性能
- 大规模并行RWG矩量法矩阵填充优化被引量:3
- 2016年
- 针对并行RWG矩量法进程间冗余积分问题,通过优化网格编号提出了一种高效的并行矩阵填充方案.在矩阵块循环分布并行策略基础上,对三角形公共边进行重新编号,使得需要相同三角形积分的矩阵元素分布在同一进程上,从而大幅度地减少进程间的冗余积分计算.数值结果表明,该并行矩阵填充方案消除了绝大部分的进程间冗余积分,提高了并行矩阵填充的效率.
- 陈岩张玉王永赵勋旺林中朝
- 国产CPU平台中高阶矩量法10万核并行性能
- 2017年
- 针对国产超级计算机平台上大规模电磁仿真软件相对匮乏,本文将并行高阶矩量法程序移植到国产超级计算机平台上,并以机载线天线阵列的辐射特性计算为例对其并行性能进行了测试和评估。实现了并行高阶矩量法单一任务突破10万CPU核规模,这是目前在国产超级计算机平台上实现的最大规模并行矩量法计算。以1440核为基准,使用CPU核数达到102400,并行规模扩大约70倍时,并行矩量法矩阵方程求解并行效率仍在50%以上。这一研究工作,使利用纯国产超级计算机对复杂电大电磁系统进行精确高效仿真成为可能。
- 左胜林中朝陈岩张玉赵勋旺
- 关键词:矩量法超级计算机
- 一种可扩展异构并行核外高阶矩量法被引量:3
- 2017年
- 为了实现异构并行矩量法可跨节点,研究了CPU/GPU与CPU/MIC分布式异构平台上矩量法并行编程模型.利用图形处理器通用编程标准CUDA中提供的CONTEXT技术及集成众核中环境变量的概念,提出了一种适用于CPU/GPU与CPU/MIC的通用异构并行编程模型,满足了异构并行矩量法可跨节点对静态负载均衡的要求.数值结果表明,基于该并行编程模型设计的异构并行矩量法程序,可获得理想的加速比并具有良好的可扩展性.
- 左胜陈岩张玉赵勋旺林中朝
- 关键词:矩量法异构平台并行编程模型可扩展性
- 大规模并行高阶矩量法的容错算法研究
- 2017年
- 基于超级计算机的大规模并行电磁计算对于解决实际工程中的复杂电磁难题具有重要意义,但超级计算机中由节点故障导致的进程崩溃事件的概率远远高于普通计算机。该文针对传统电磁计算难以有效应对进程崩溃的现状,提出一种高效的、适用于大规模并行高阶矩量法的容错算法。在现有并行高阶矩量法的基础上,基于"硬盘缓存"和"直接内存读取"设计高效率、高可靠性的现场保护算法,同时设计了高效的断点恢复算法。算法的有效性主要在于"固定的现场保护点"这一特点,它使得算法在有故障的情况下仍然可以正常有序地进行;而原算法每次碰到故障,则只能从头计算。数值仿真实验验证了容错算法在应对进程崩溃事件时的有效性,大幅提高了大规模并行高阶矩量法的可靠性。
- 陈岩林中朝张玉赵勋旺
- 关键词:超级计算机容错算法可靠性