国家重点实验室开放基金(51479040103KG0201)
- 作品数:7 被引量:22H指数:3
- 相关作者:齐星云窦文华陈永然迟利华刘杰更多>>
- 相关机构:国防科学技术大学北京应用物理与计算数学研究所装备指挥技术学院更多>>
- 发文基金:国家重点实验室开放基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 数值并行计算可扩展性评价与测试被引量:14
- 2005年
- 分析了几种可扩展性能评价模型存在的问题,针对实际评价与测试的需要,提出了一种基于等平均负载的数值并行计算可扩展性评价模型.该评价模型对可扩展性能加速比和可扩展性进行了重新定义,给出了使用该模型的进行可扩展加速比和可扩展性测试的方法,结合曲线拟合或并行计算时间模型可以预测并行系统的可扩展性,对NPBBT,SP和矩阵乘法进行了可扩展性预测.
- 迟利华刘杰胡庆丰
- 关键词:可扩展性加速比性能评价模型
- 一种改进的适合并行计算的共轭剩余算法被引量:6
- 2006年
- 通过改变CR算法的计算次序,提出了一种改进的共轭剩余(ICR)算法.对比CR算法,ICR算法的数值稳定性和CR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为CR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性,可以进行计算与通信的重叠.从理论和实验两个角度来讨论ICR算法的性能,当处理机台数较多时ICR算法的计算速度快于CR算法.在64台处理机机群上进行的数值实验表明,并行ICR算法的计算速度大约比CR算法快30%.
- 刘杰刘兴平迟利华胡庆丰
- 关键词:并行计算机群
- 一种改进的适合并行计算的TFQMR算法被引量:3
- 2005年
- TFQMR算法是一种Krylov子空间算法,常用来求解大型稀疏线性方程组.通过改变TFQMR算法的计算次序,提出了一种改进的TFQMR(ITFQMR)算法.对比TFQMR算法,ITFQMR算法的数值稳定性和TFQMR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为TFQMR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性,可以进行计算与通信的重叠.从理论和实验两个角度来讨论ITFQMR算法的性能,当处理机台数较多时,ITFQMR算法的计算速度快于TFQMR算法.实验说明了在有64台处理机机群上进行,最快的并行ITFQMR算法的计算速度大约比TFQMR算法快20%.
- 刘杰迟利华胡庆丰李晓梅
- 关键词:并行计算机群大型稀疏线性方程组
- PMPS:一个并行系统性能模型被引量:1
- 2007年
- 传统的性能评价方法已经无法满足规模不断扩大的并行系统性能分析的要求。近几年来,新的性能评价方法——性能模型得到了广泛的研究。本文通过对现有模型的研究,提出一个开放式性能模型(PMPS),并研究了实现该模型的关键技术。
- 陈永然齐星云窦文华
- 基于系统抽样的并行程序性能特征分析方法及其实现被引量:2
- 2007年
- 程序性能特征分析是理解程序行为的基础,对识别程序性能瓶颈、了解软硬件资源利用状况具有重要作用.特别在大规模并行系统的性能评价中,受时间和空间的约束无法分析完整应用性能特征.一个有效的方法是通过抽样的方法分析应用程序部分代码的性能特征,以此代表完整应用的性能特征.分析了Profiler程序负载来源,提出了基于抽样的程序性能特征分析方法,并基于该方法实现了性能特征分析器SamplePro.与其他方法比较,基于系统抽样的程序性能特征方法在最小样本容量下得到最优的分析结果,仅需抽样分析1%~3%的程序指令就能实现小于3%的分析误差.
- 陈永然窦文华钱悦齐星云
- 一个面向I/O密集型并行应用的性能模型被引量:2
- 2007年
- 近几年,性能模型作为一种新的并行系统性能分析方法,得到学术界和工业界的广泛重视.给出了一个开放式性能模型框架结构PMPS(n)并实现了该框架下的一个面向I/O密集型并行应用模型PMPS(3),使用该模型分析了各种NPB程序在PⅣ机群系统上的性能.实验结果表明,对存储密集型应用,PMPS(3)模型与PERC模型预测结果相当;对I/O密集型应用性能的预测,PMPS(3)模型优于PERC模型.进一步分析发现,应用的数据相关、控制相关和操作重叠会影响模型预测结果.实验结果还说明了PMPS(n)性能模型具有很好的扩展性.
- 陈永然齐星云窦文华
- DoubleP:一个有效的节点关键性能因素发现与聚类方法
- 2007年
- 随着处理器设计复杂性的提高,影响处理器节点性能的因素也越来越多.受资源(时间和空间)的限制,很难采集并分析所有影响性能因素的应用特征参数和机器性能轮廓参数.如何在众多的性能参数中提取影响性能的关键因素,成为并行系统节点性能评价中首先要解决的问题.提出了一个有效的DoubleP性能因素发现与聚类方法,该方法将众多复杂的性能因素聚焦到几个性能主成份上,明确了分析对象.通过DoubleP方法的分析,发现了14个影响处理器节点性能的关键因素和4个性能主成份.
- 陈永然窦文华齐星云钱悦
- 关键词:聚类主成份分析