谢力
- 作品数:2 被引量:2H指数:1
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:理学自动化与计算机技术更多>>
- 基于多层半可分结构矩阵的快速算法与并行实现被引量:1
- 2017年
- 基于多层半可分(HSS)结构矩阵的快速算法可有效降低具有数值低秩属性的稠密线性方程组求解的复杂度.采用随机取样和保结构秩显(SPRR)分解相结合的方法替代秩显QR(RRQR)分解可以快速构造HSS结构矩阵.该方法将压缩构造HSS结构矩阵转换成小矩阵计算,减少存储和通信开销,使构造HSS结构矩阵的时间复杂度进一步降低.在分布式机群上采用ScaLapack的二维循环块分布方式存储各矩阵块,将HSS树和处理机网格进行映射.构造HSS结构矩阵的并行算法包括对矩阵的多层块压缩,数据交换和重分布,然后结合并行ULV分解和并行三角求解实现快速并行求解,分析了该并行算法的复杂度.最后以二维电磁散射问题为例,数值结果表明该算法不仅比直接LU分解快一个数量级,而且具有良好的并行可扩展性.
- 谢力王武冯仰德
- 基于异构平台的BH算法高效并行实现被引量:1
- 2016年
- 针对多核CPU和众核加速器或协处理器异构平台的架构特征进行了研究,以MPI和Open MP混合编程模型实现了N体问题BH算法的并行,采用了正交递归二分法(ORB)使进程之间负载均衡,并对程序进行了并行优化和MIC加速。优化和加速后的程序性能提升到原版本的3.4倍以上,其中MIC加速后性能提升到加速前的1.7倍;程序具有较好的扩展性,计算粒子规模达到上亿时,可扩展到32个节点共4 480核心(640个CPU核心和3 840个MIC核心)。
- 李婵怡王武冯仰德谢力
- 关键词:N体问题异构平台并行计算