搜索到1187篇“ 并行编程“的相关文章
一种支持并行编程中的实时数据流处理的并行计算方法
本申请提供一种支持并行编程中的实时数据流处理的并行计算方法,包括:实时数据流通过并行流水线划分分片,由不同线程过滤指定字段以提高效率;完成过滤后,利用MapReduce的局部聚合功能对结果进行局部聚合,减少数据量;建立基...
董贇蒙志鹏刘凯杰蒙琦艾徐华陈昭利张丽媛杨崇富
一种量子-经典异构并行编程系统及运行方法
一种量子‑经典异构并行编程系统及运行方法,基于高性能计算体系结构、高性能计算操作系统、作业管理系统以及并行运行时环境,通过编程系统和作业管理系统的配合,在当前阶段的系统中实现量子‑经典异构并行;1)为不同的结点设置不同结...
刘雍吴俊杰付祥邓明堂董勇吴振伟戴屹钦
一种基于异构众核处理器的并行编程模型及其构建方法
本发明公开一种基于异构众核处理器的并行编程模型及其构建方法,包括:基于非对称的容器方案进行构建,得到一初始主处理器和若干初始从处理器;在初始主处理器和若干初始从处理器上,基于非对称的对象操作系统方案进行构建,得到一主处理...
吴翔虎魏明寇光丽
一种并行编程中的错误处理方法
本申请提供一种并行编程中的错误处理方法,包括:根据应用程序的源代码,采用源代码分析工具PMD获取程序的结构,确定并行执行单元的位置;根据错误数据,采用决策树算法,将相似类型的错误汇总,并根据错误信息映射和分类结果,为每个...
董贇刘凯杰蒙琦艾徐华蒙志鹏杨崇富陈昭利廖邓彬
面向GPU并行编程的线程同步综述
2024年
并行计算已成为主流趋势.在并行计算系统中,同步是关键设计之一,对硬件性能的充分利用至关重要.近年来,GPU(graphic processing unit,图形处理器)作为应用最为广加速器得到了快速发展,众多应用也对GPU线程同步提出更高要求.然而,现有GPU系统却难以高效地支持真实应用中复杂的线程同步.研究者虽然提出了很多支持GPU线程同步的方法并取得了较大进展,但GPU独特的体系结构及并行模式导致GPU线程同步的研究仍然面临很多挑战.根据不同的线程同步目的和粒度对GPU并行编程中的线程同步进行分类.在此基础上,围绕GPU线程同步的表达和执行,首先分析总结GPU线程同步存在的难以高效表达、错误频发、执行效率低的关键问题及挑战;而后依据不同的GPU线程同步粒度,从线程同步表达方法和性能优化方法两个方面入手,介绍近年来学术界和产业界对GPU线程竞争同步及合作同步的研究,对现有研究方法进行分析与总结.最后,指出GPU线程同步未来的研究趋势和发展前景,并给出可能的研究思路,从而为该领域的研究人员提供参考.
高岚赵雨晨张伟功王晶钱德沛
关键词:并行编程线程同步
线程串行化、分布式并行编程、和运行时间扩展
系统、设备、和方法可提供用于处理图形数据、和用于针对图形环境修改并行计算平台中的运行时间环境的技术。
A.科克J.克维特科夫斯基T.施吕斯勒J.雷A.阿普A.沙E.奥尔德-艾哈迈德-瓦尔G.利克托尔I.沃尔德J.金特J.阿姆斯图茨
一种用于多样化计算任务需求的并行编程方法
本申请提供一种用于多样化计算任务需求的并行编程方法,包括:通过分析系统中多核或多处理器的规格和能力,对各处理器的内存访问代价进行量化;根据处理器的内存访问代价和任务的复杂性,进行初步的任务到处理器的映射;分析实时任务的时...
董贇 刘凯杰 蒙志鹏 潘俊冰 蒙琦 艾徐华 陈昭利 张丽媛
一种并行编程中的任务划分和负载平衡方法
本申请提供一种并行编程中的任务划分和负载平衡方法,包括:自动扫描待执行任务池,获取待执行任务数据,并确定任务属性,所述任务属性包括数据依赖关系、计算复杂度和通信需求;根据所述任务属性和历史执行数据,利用SVR模型预测每个...
董贇 刘凯杰 蒙志鹏 廖邓彬 蒙琦 艾徐华 陈昭利 张丽媛
任务并行编程模型下排列熵算法的并行实现
2024年
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。
李维权
关键词:OPENMP
面向GPU并行编程的哈希表性能评测与分析被引量:1
2024年
哈希表是一种重要的索引数据结构,具有天然的并行性;GPU的单指令多线程工作模式大大提高了运算速率,但是哈希表内存访问的天然随机性、线程间的同步、GPU有限的内存等问题,给哈希表在GPU上的实现带来了很多挑战。针对上述挑战,目前已有众多的研究工作尝试利用GPU对哈希表进行加速,并取得了良好的效果。然而,已有的哈希方案尚未有全面、系统、统一的对比,使编程人员无法很好地了解在某一特定的应用场景中哈希表的性能排序,给哈希方案的选择带来一定的挑战。文章调查、分析并测评了几种基于GPU的典型哈希方案,并基于测评结果总结了影响哈希表性能的关键因素,最后对于哈希表的选择和使用,给出了相关建议。
郑翠翠
关键词:GPU哈希表哈希冲突数据结构

相关作者

董小社
作品数:285被引量:593H指数:12
供职机构:西安交通大学
研究主题:线程 分布式存储系统 GPU 云计算 超级计算机
祝永志
作品数:55被引量:149H指数:7
供职机构:曲阜师范大学
研究主题:并行计算 负载均衡 BEOWULF 可扩展性 MPICH
郑启龙
作品数:100被引量:193H指数:6
供职机构:中国科学技术大学计算机科学与技术学院
研究主题:DSP MAPREDUCE 分簇 数字信号处理器 超长指令字
孙济洲
作品数:253被引量:847H指数:17
供职机构:天津大学
研究主题:相机 重定位 计算机图形学 入侵检测 图像
臧斌宇
作品数:244被引量:256H指数:8
供职机构:上海交通大学
研究主题:内存 虚拟机 RDMA 服务器 控制流