彭林
- 作品数:76 被引量:29H指数:3
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金湖南省教育厅优秀青年基金更多>>
- 相关领域:自动化与计算机技术文化科学兵器科学与技术军事更多>>
- 面向存储层次设计优化的GPU程序性能分析被引量:2
- 2017年
- 图形处理器凭借着比传统CPU更高的峰值性能和能效,以及日渐成熟的软件环境,逐渐成为构建异构并行系统的最流行的加速器之一。虽然GPU依靠轻量级线程的灵活切换来隐藏访存延迟,但其超高的并发度仍然给存储系统带来了很大压力,其性能的有效发挥受访存效率的强烈影响。因此GPU程序的访存行为分析及优化一直是GPU相关领域的研究热点,但很少有工作从体系结构的角度分析存储层次的设计对性能的影响。为了更好地指导GPU存储层次的设计和访存优化,从实验的角度详细地分析了GPU各存储层次对程序性能的影响,并总结出若干指导性的优化策略,为未来类似体系结构的存储层次设计和程序优化提供建议。
- 唐滔彭林黄春杨灿群
- 关键词:异构系统图形处理器性能分析
- 基于负载均衡的并行序列比对方法、装置和计算机设备
- 本申请涉及一种基于负载均衡的并行序列比对方法、装置、计算机设备和存储介质。所述方法包括:通过在集群的每个节点上启动进程,将待比对文件按照文件数据量进行均分,在每个进程上执行等数据量的序列比对,根据集群中进程的编号获取进程...
- 夏泽宇张昂杨灿群崔英博黄春唐滔彭林方建滨张鹏龙思凡
- 一种SPH的向量化并行计算方法及装置
- 本申请涉及一种SPH的向量化并行计算方法、装置、计算机设备和存储介质。所述方法包括:通过将邻近粒子搜索范围内粒子的原始AoS数据重新组织为SoA数据,使得SoA数据符合所使用的SIMD指令集要求,通过SIMD技术的向量化...
- 杨灿群龙思凡郭晓威范小康李超崔英博黄春唐滔彭林方建滨张鹏夏泽宇
- 文献传递
- 面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质
- 本发明涉及计算机高性能计算的可靠性保证领域,公开了一种面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质。针对非阻塞MPI程序的异步性和非确定性,本发明通过为通信操作的不同消息匹配情况和不同交叠执行情况创建不同待探索...
- 于恒彪黄春王戟陈振邦傅先进彭林唐滔左克姜浩沈洁方建滨
- 文献传递
- 一种基于超越函数加速指令的正余弦函数实现方法及系统
- 本发明公开了一种基于超越函数加速指令的正余弦函数实现方法及系统,本发明方法包括对传入的向量操作数vd的每个元素规约到[‑π/4,π/4]区间,获得对应的整型向量vql以及位于[‑π/4,π/4]区间内的浮点数向量vdr;...
- 沈洁龙标黄春彭林唐滔姜浩范小康于恒彪易昕苏醒
- 阵列异构型计算系统上动态构建软件超结点的方法和装置
- 本申请涉及一种阵列异构型计算系统上动态构建软件超结点的方法、装置、计算机设备和存储介质。所述方法包括:通过在阵列异构型计算系统中每一个物理结点的后台启动一个守护进程,通过超结点配置进程将每一个物理结点的主机名、结点的身份...
- 卢凯杨灿群唐滔崔英博黄春彭林方建滨张鹏沈洁姜浩
- 文献传递
- 面向投机并行的点点同步算法
- 线程级投机并行可以利用多核系统的计算能力提高应用程序的性能。串行程序被分割为多个线程并行执行,通过运行时系统保证对包含数据依赖代码按照其串行次序执行。投机成功时,可以极大增加系统并发度,但是投机失败时开销较大。对于一类发...
- 张小强彭林谢伦国田祖伟
- 关键词:并行计算机调度程序
- 文献传递
- 面向容错的NVM持久化过程冗余信息的压缩方法和装置
- 本发明公开了一种面向容错的NVM持久化过程冗余信息的压缩方法及装置,本发明实施步骤包括分配写集合、地址队列以及多个值队列,在NVM中分配持久化日志保存区;在事务期间将所有持久化写操作信息写入写集合;扫描写集合,按照值的新...
- 彭林张文喆陈俊峰黄春唐滔方建滨左克姜浩
- 文献传递
- 函数调用栈解析和回溯方法与装置
- 本申请涉及一种函数调用栈解析和回溯方法及装置,所述方法包括:通过转储异常中断或者手动中断应用程序的执行现场,并根据中断应用程序中终止函数正在执行的代码地址在可执行文件中找到所述终止函数的函数代码,并对处理后的函数代码进行...
- 张鹏方建滨黄春彭林唐滔崔英博
- 基于局部窗口的序列比对方法、装置、设备及存储介质
- 本发明涉及一种基于局部窗口的序列比对方法、装置、设备及存储介质。所述方法包括:构建参考基因组的窗口索引表。截取参考基因组的读段中部序列作为种子区域,根据种子区域获取种子k‑mer序列。根据种子k‑mer序列与窗口索引表中...
- 林明鑫崔英博唐滔刘豪然彭林黄春