您的位置: 专家智库 > >

曾露

作品数:4 被引量:1H指数:1
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 3篇多核
  • 3篇多核处理
  • 3篇多核处理器
  • 3篇缓存
  • 3篇处理器
  • 2篇片上多核处理...
  • 1篇一致性
  • 1篇阵列
  • 1篇数据压缩
  • 1篇区域共享
  • 1篇自适
  • 1篇自适应
  • 1篇字典压缩
  • 1篇伪造
  • 1篇系统I/O
  • 1篇现场可编程
  • 1篇现场可编程门...
  • 1篇粒度
  • 1篇门阵列
  • 1篇可编程门阵列

机构

  • 4篇中国科学院
  • 4篇中国科学院大...
  • 4篇龙芯中科技术...

作者

  • 4篇曾露
  • 2篇李鹏
  • 2篇陈新科
  • 1篇吴瑞阳

传媒

  • 4篇高技术通讯

年份

  • 1篇2018
  • 1篇2016
  • 1篇2015
  • 1篇2014
4 条 记 录,以下是 1-4
排序方式:
基于区域协作的Cache压缩
2016年
为提高Cache的有效容量,进行了Cache压缩研究,并提出了一种区域协作压缩(RCC)方法,以提升最后一级缓存的压缩率。与传统的Cache压缩算法不同,RCC方法利用了缓存区域的压缩局部性,使用缓存区域中第一个缓存块的字典信息来协作压缩缓存区域中的其他各个缓存块,而不需要对缓存区域进行整体压缩。RCC有效发掘了缓存区域内缓存块之间的数据冗余,实现了接近以缓存区域为压缩粒度的字典压缩的压缩率,然而压缩、解压缩延时却仍然和压缩单个缓存块时相当。实验结果表明,与单缓存块压缩算法C-PACK相比,RCC方法的压缩率平均提升了12.34%,系统的性能提升了5%。与2倍容量的非压缩Cache相比,有效容量提升了27%,系统性能提升了8.6%,而面积却减少了63.1%。
曾露李鹏王焕东
关键词:数据压缩字典压缩
基于FPGA模拟片上多核处理器的新方法
2014年
为了解决使用现场可编程门阵列(FPGA)进行大规模片上多核处理器模拟的容量限制难题,提出了一种新颖的FPGA模拟方法。该方法通过混合真实的处理器核与伪造的处理器核,使用1个或2个FPGA即可模拟整个片上多核处理器,而且可以有效克服FPGA的容量限制问题,同时又不过多损害对多核处理器行为特征的有效模拟。用此方法实现了周期精确的全芯片模拟,并使用流片后的片上多核处理器芯片对此模拟方法进行了有效性验证。实验很容易地实现了50MHz以上的模拟速度,比基于相同设计的软件仿真快10万倍以上。模拟速度的大幅度提升,使得可以启动未经修改的Linux操作系统和运行完整的多用户SPEC CPU2006 train测试集。这种混合真实处理器核与伪造处理器核的模拟方法为片上多核处理器的功能验证和性能评估提供了一种简单高效的途径。
陈新科黄帅王焕东吴瑞阳曾露
关键词:仿真片上多核处理器
多核处理器系统I/O访存优化研究被引量:1
2018年
本文提出了一种多核处理器自适应I/O直接缓存访问(ADCA)的方法以提升I/O访存的性能,降低对其他程序的影响。与传统直接缓存访问(DCA)不同的是,该方法利用了LRU栈特性,通过采样辅助标签目录的方式动态调整DCA可使用的cache空间,同时对I/O数据的替换和写内存策略进行优化。实验结果表明,与DCA方式相比,该方式使得I/O带宽提升了大约10%,而与SPEC和采用直接内存访问(DMA)方式的网络测试程序同时运行相比,SPEC定点和浮点性能分别提升了11. 5%和8. 9%。
李鹏曾露曾露
关键词:自适应
片上多核处理器的区域共享的双粒度目录
2015年
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需要为共享缓存区域创建额外的块目录项的问题,提出了创新的区域共享的双粒度目录(RSDGD)结构。该结构可用一个区域共享目录项同时维护最多3个共享者共享同一个缓存区域的一致性,从而能有效减少所需的块目录项数量,降低总的目录开销。实验结果表明,和原有的DGD相比,该结构平均减少了25%的目录空间需求,而仅产生了不到0.6%的性能损失。该结构有效地降低了芯片的面积开销,提高了目录结构的可伸缩性。
曾露陈新科王焕东
关键词:片上多核处理器缓存一致性区域共享
共1页<1>
聚类工具0