您的位置: 专家智库 > >

罗力

作品数:4 被引量:2H指数:1
供职机构:中国科学院深圳先进技术研究院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 3篇自动化与计算...
  • 2篇理学

主题

  • 2篇偏微分
  • 2篇偏微分方程
  • 2篇求解偏微分方...
  • 2篇微分
  • 2篇微分方程
  • 1篇预条件
  • 1篇神威
  • 1篇图形处理单元
  • 1篇区域分解算法
  • 1篇结构网格
  • 1篇可扩展
  • 1篇非结构
  • 1篇非结构网格
  • 1篇PDES
  • 1篇PROBLE...
  • 1篇APPLIC...
  • 1篇CPU
  • 1篇GAUSS-...
  • 1篇GPU集群
  • 1篇JACOBI

机构

  • 4篇中国科学院
  • 2篇中国科学院软...
  • 1篇国防科学技术...
  • 1篇科罗拉多大学

作者

  • 4篇罗力
  • 2篇杨超
  • 1篇刘杰
  • 1篇陈荣亮
  • 1篇赵宇波
  • 1篇蔡小川

传媒

  • 1篇计算机学报
  • 1篇集成技术

年份

  • 1篇2019
  • 1篇2017
  • 1篇2012
  • 1篇2011
4 条 记 录,以下是 1-4
排序方式:
A parallel finite element method for 3D moving contact line problem in complex domain with applications
Moving contact line problem plays an important role in fluid-fluid interface motion on solid surfaces.The prob...
罗力
GP-GPU集群上求解偏微分方程的可扩展多层次算法
本文提出并测试一种基于这类集群架构的多层次算法。算法的可扩展性通过两层区域分解算法实现,而GPU的性能由基于光滑聚集的代数多重网格法获得。本文采用32 CPU/GPU求解差分离散后达三千万未知数的偏微分方程。
罗力杨超史峰赵宇波蔡小川
关键词:偏微分方程图形处理单元
CPU/GPU集群上求解偏微分方程的可扩展混合算法被引量:2
2012年
当前世界上排前几位的超级计算机都基于大量CPU和GPU组合的混合架构,它们对某些特殊问题,譬如基于FFT的图像处理或N体颗粒计算等领域可获得很高的性能。但是对由有限差分(或基于网格的有限元)离散的偏微分方程问题,于CPU/GPU集群上获得较好的性能仍然是一种挑战。本文提出并测试一种基于这类集群架构的混合算法。算法的可扩展性通过区域分解算法实现,而GPU的性能由基于光滑聚集的代数多重网格法获得,避免了在GPU上表现不理想的不完全分解算法。本文的数值实验采用32CPU/GPU求解用差分离散后达三千万未知数的偏微分方程。
罗力杨超赵宇波蔡小川
关键词:PDES
面向异构众核架构的块Gauss-Seidel/Jacobi预条件算法
2019年
Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss-Seidel/Jacobi算法,将其作为区域分解算法的子区域求解器.面向神威太湖之光超级计算机的异构众核架构,设计并实现了该算法.为充分利用神威太湖之光国产SW26010芯片中每个CPE拥有的高速LDM(Local Data Memory),缓解通信瓶颈,设计了多行块通信打包、计算与通信重叠性能优化策略和丢弃非关键元素的低通信复杂性数值优化方法.数值实验结果显示,相较于串行Gauss-Seidel算法,优化后的块Gauss-Seidel/Jacobi算法预处理过程加速比最高可达到4.16倍.以1040核的测试数据为基准,在处理器核数达到33280时,块Gauss-Seidel/Jacobi预条件算法的并行效率达到61%.
吴立垒陈荣亮罗力闫争争廖子菊迟利华刘杰
关键词:非结构网格区域分解算法
共1页<1>
聚类工具0