2024年12月24日
星期二
|
欢迎来到佛山市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
刘昊
作品数:
3
被引量:10
H指数:1
供职机构:
中国科学院软件研究所
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
张鹏
中国科学院软件研究所
杨超
中国科学院软件研究所
刘芳芳
中国科学院软件研究所
孙乔
中国科学院软件研究所
赵玉文
中国科学院软件研究所
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
专利
1篇
期刊文章
领域
1篇
自动化与计算...
主题
3篇
BLAS
2篇
代码
2篇
代码设计
2篇
代数
2篇
数学库
2篇
平台架构
2篇
线性代数
2篇
架构
2篇
核心代码
1篇
多核
1篇
函数优化
机构
3篇
中国科学院软...
1篇
中国科学院大...
作者
3篇
刘芳芳
3篇
杨超
3篇
张鹏
3篇
刘昊
2篇
赵玉文
2篇
孙乔
1篇
蒋丽娟
传媒
1篇
计算机系统应...
年份
1篇
2019
2篇
2016
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口?driver驱动?kernel汇编核心代码”的三层代码设计框架,使用乘加指...
刘昊
杨超
刘芳芳
赵玉文
张鹏
孙乔
基于申威1600的3级BLAS GEMM函数优化
被引量:10
2016年
BLAS是当前科学计算领域重要的底层支持数学库之一,其中的3级BLAS函数应用最为广泛.本文基于国产申威1600平台,提出了一种基础线性代数库BLAS的三级函数通用矩阵乘GEMM的高性能实现方法.在单核上,使用乘加指令、循环展开、软件流水线指令重排、SIMD向量化运算、寄存器分块技术等与平台架构相关的技术手段,实现汇编级手工优化;在多核上,提出了适用于该平台的多线程加速方案.实验结果显示,在单核串行性能测试中,与知名开源数学库Goto BLAS相比,我们实现了平均4.72倍的加速效果;在多核并行扩展测试中,4线程版的性能则平均达到了单线程版性能的3.02倍.
刘昊
刘芳芳
张鹏
杨超
杨超
关键词:
多核
一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口‑driver驱动‑kernel汇编核心代码”的三层代码设计框架,使用乘加指...
刘昊
杨超
刘芳芳
赵玉文
张鹏
孙乔
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张