公共文化服务平台

共 5 条记录，以下是 1-5

全选清除导出

排序方式：

基于RAPL的机群系统功耗限额控制: 2017年; 功耗管控是高性能计算系统和分布式数据中心管理的热点问题。当机房供电受限时需要对机群系统的功耗上限进行控制,使有限的电力适应供电容量的动态变化。为此,设计并实现一个基于RAPL的功耗限额控制系统。建立机群系统功耗模型,利用RAPL对CPU功耗限额的控制能力并结合功耗差额测量方法,将机群系统功耗上限控制在设定限额内,在此基础上尽可能减少程序性能的损失。实验结果表明,在较小的性能损失下,该系统可有效降低峰值功耗并将其稳定在限额内。; 刘嵩刘轶杨海龙周彧聪

基于逐步细化快照序列的多核并行程序调试: 2017年; 多核并行程序的调试是一个公认的困难问题,困难主要来自于程序执行的不确定性.可重现调试(replay debug)提供了消除程序中不确定性的能力,但是现有的可重现调试解决方案都无法应用于商用的软硬件平台中,且进行调试所带来的性能损失会随着并发度的增加而超线性地增长.提出了一种基于运行快照的新型并行程序调试方法SDT(snapshot debug tool).该方法以离线的断点设置、运行快照捕捉和运行快照细化为基础,提出了一套可以指导用户由粗到细发现错误的调试过程,并在通用的软硬件平台上进行了实现.实验结果显示,在8线程的并发条件下,使用SDT调试所带来的时间性能损耗平均为51.88%;同时当线程数增长4倍时,使用SDT所带来的额外时间消耗最多增长1倍,具有很好的可扩展性.记录快照的数据量是影响SDT性能的重要挑战,实验证明通过使用增量式的快照记录方式可以有效地降低需要记录的数据量,减少记录快照花费的时间,提高SDT的整体性能.; 王博弘刘轶张国振钱德沛; 关键词：多线程

SimHPC:一种基于执行驱动的大规模并行系统模拟器被引量：3: 2013年; 模拟实验方法对高性能计算机系统的性能评价和优化设计有着重要的意义,然而由于目标系统规模庞大,传统的体系结构模拟器难以满足模拟性能方面的要求.文中提出了一种专门用于高性能计算系统的模拟器——SimHPC,该模拟器采用执行驱动的全系统模拟方法,支持操作系统和应用程序的模拟运行.通过采用与目标系统同构的节点作为宿主节点以及并行模拟的方法,使得模拟性能相比传统的体系结构模拟器大幅提高,与现有的几种大规模并行系统模拟器相比,SimHPC在通用性和模拟性能方面也具有一定的优势.; 刘轶支予哲张昕李鹤焦林张鹏苏阳明倪泽辉钱德沛; 关键词：模拟器性能评价

基于YARN集群的计算加速部件扩展支持被引量：6: 2016年; 以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU,缺少对计算加速部件的支持.在YARN中添加计算加速部件需要解决多个难点,分别是计算加速部件资源如何调度以及异构节点间如何共享问题、多个任务同时调用计算加速部件而引起的资源争用问题和集群中对计算加速部件的状态监控与管理问题.为了解决这些问题,提出了动态节点捆绑策略、流水线式的计算加速部件任务调度等,实现了YARN对计算加速部件的支持,并通过实验验证了其有效性.; 李钦朱延超刘轶钱德沛; 关键词：分布式系统 YARN 任务调度

NUMA架构内多个节点间访存延时平衡的内存分配策略被引量：4: 2017年; 随着多核架构的发展和普及,NUMA多核架构凭借其本地访存低延时的优势,被各大商业数据中心以及科学计算集群广泛采用.NUMA架构通过增加多个内存控制器,缓解了多核架构下对同一个内存控制器的争用问题,但同时也增加了内存管理的负担.Linux的系统开发者为了实现充分利用NUMA本地访存低延时的特点,在为进程分配内存时,选择进程当前正在运行的NUMA节点作为分配内存的目标节点.这种分配会导致进/线程之间共享内存的不公平.例如,一个在当前本地节点被分配很多内存的进程,可能被调度到远端节点运行,这样会导致进程的性能波动.针对这一问题,该文设计了一种保证NUMA架构内各内存节点间访存延时平衡的内存分配策略,并在Linux系统中实现和验证.延时的获取方法依赖平台,但是系统内核的策略是通用的.实验结果表明,与Linux默认的内存分配策略相比,进/线程间的不公平性平均降低了16%(最多34%),并且各进/线程的性能没有较大抖动.; 李慧娟栾钟治王辉杨海龙钱德沛

全选清除导出

共1页<1>

国家高技术研究发展计划(2012AA01A302)