您的位置: 专家智库 > >

国家自然科学基金(61272132)

作品数:6 被引量:12H指数:2
相关作者:吴俊敏隋秀峰唐轶轩陈国良胡蝶更多>>
相关机构:中国科学技术大学中国科学院更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点实验室开放基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 6篇自动化与计算...

主题

  • 3篇处理器
  • 1篇多核
  • 1篇多核处理
  • 1篇多核处理器
  • 1篇多媒体
  • 1篇多媒体设备
  • 1篇多目标
  • 1篇多线程
  • 1篇多线程程序
  • 1篇性能评测
  • 1篇虚拟化
  • 1篇虚拟机
  • 1篇设备共享
  • 1篇设备虚拟化
  • 1篇图像
  • 1篇图像处理
  • 1篇图像处理器
  • 1篇评测
  • 1篇线程
  • 1篇芯片

机构

  • 5篇中国科学技术...
  • 3篇中国科学院

作者

  • 5篇吴俊敏
  • 2篇陈国良
  • 2篇朱小东
  • 2篇胡蝶
  • 2篇唐轶轩
  • 2篇隋秀峰
  • 1篇姜邦杰
  • 1篇罗琳
  • 1篇黄景
  • 1篇李科君
  • 1篇陈明宇
  • 1篇吕慧伟
  • 1篇张朋飞
  • 1篇郑焕鑫
  • 1篇吴志敏
  • 1篇王彦

传媒

  • 1篇计算机研究与...
  • 1篇计算机工程
  • 1篇计算机系统应...
  • 1篇计算机工程与...
  • 1篇系统仿真学报
  • 1篇计算机科学

年份

  • 1篇2016
  • 1篇2014
  • 4篇2013
6 条 记 录,以下是 1-6
排序方式:
广义霍夫变换在多目标检测领域的应用及优化被引量:5
2016年
分析了广义霍夫变换(GHT)的原理及在目标检测领域的已有研究,在原单目标检测的基础上,加入了多个相似目标物体检测与计数的能力,根据阈值的设定,能够快速准确地从图像中同时识别出多个目标物体,并记录下各目标物体的相关位置信息。利用GPU对GHT算法进行加速,充分挖掘算法各个步骤的潜在并行性,并结合GPU中的各种存储器优化方法,合理安排各存储器的存储数据,实验结果表明,GPU极大提升了算法的运行速度。
王彦吴俊敏郑焕鑫
关键词:目标检测
基于KVM的远程声卡显卡虚拟化技术被引量:2
2013年
针对家庭多媒体环境下的设备共享问题,提出了一种基于KVM虚拟机的远程设备虚拟化技术方案.该方案利用了KVM虚拟机的设备模拟技术,在其设备模拟模块QEMU中实现远程设备虚拟化,使得本地用户能够像使用本地的设备一样使用远程的真实物理设备.接着描述了远程虚拟声卡和显卡的具体实现以及相应的优化措施,并且利用远程虚拟显卡实现了屏幕扩展功能,最后通过实验进行性能分析.本方案优点在于仅需要在用户态的虚拟设备层添加所需要的远程设备的虚拟化,方便灵活且系统的安全性高同时不需要修改客户操作系统.
姜邦杰吴俊敏朱小东李科君罗琳张朋飞胡蝶
关键词:KVM虚拟机设备虚拟化设备共享多媒体设备
一种结合硬件特征的并行内存故障检测方案
2014年
针对March类内存检测算法越来越复杂、检测时间越来越长,且更适用于对嵌入式内存芯片的检测等问题,提出一种结合硬件特征的并行内存故障检测方案。该方案包括2种并行检测方法:(1)根据DDR2的结构和工作原理设计的芯片级并行,可以并行检测一个DDR2内部的多个内存芯片。(2)根据访存控制器的结构和工作原理设计的访存控制器级并行,可并行检测多个DDR2内存条。对于芯片级并行,访存带宽越大,即并行检测的芯片个数越多,并行效果越好,从1个芯片到并行检测8个芯片,内存的检测时间几乎是呈线性递减的。对于访存控制器级并行,访存控制器数量越多并行效果越好,从1个LMC到2个LMC,内存的检测时间几乎减少了一倍。实验结果表明,2种并行检测方法不仅能够成倍加快检测速度,而且更适用于用户对内存的检测。
胡蝶吴俊敏
关键词:MARCH算法
面向多线程程序基于效用的Cache优化策略被引量:5
2013年
为了提供高速的数据访问,多核处理器常使用Cache划分机制来分配二级Cache资源,但传统的共享Cache划分算法大多是面向多道程序的,忽略了多线程负载中共享和私有数据访问模式的差别,使得共享数据的使用效率降低.提出了一种面向多线程程序的Cache管理机制UPP,它通过监控Cache中共享、私有数据的效用信息,为每个线程以及共享数据分配Cache空间,使得各个线程以及共享数据的边际效用最大化,从而提高负载的整体性能.另外,UPP还考虑了程序中数据的使用频率以及临近性信息,通过提升、动态插入策略过滤低重用数据,从而使得高频数据块留在Cache中.通过实验表明,其性能相对于基于LRU的纯共享Cache结构和基于公平的静态Cache划分结构均有提升.
唐轶轩吴俊敏陈国良隋秀峰黄景
关键词:多核处理器共享CACHE划分多线程程序
一个针对并行模拟引擎的性能评测实例
2013年
SimK是由中科院计算所体系结构国家重点实验室开发的一个并行离散时间模拟引擎。基于已经发布的SimK1.0版本,对任务划分及同步推进阻塞控制进行了功能扩展,开发了SimK的1.1版本。同时由于缺乏一个专门对SimK模拟性能评测的Benchmark以及全面的评测结果,首先讨论了并行模拟引擎Benchmark的设计准则,之后介绍了开发的Benchmark-PassBall,并且使用它对SimK的强弱扩展性、组件负载不均衡情况下的强扩展性进行了评测,同时对比了组件负载不均衡和均衡情况下的加速比,探讨了模拟计算量的变化对模拟加速比的影响,并讨论了Benchmark的适用性。通过实验讨论得出:a)PassBall可以作为并行模拟引擎SimK性能评测的Benchmark,亦可用于其他并行模拟引擎性能的评测;b)SimK具有良好的强弱扩展性;c)负载平衡和模拟计算量都会对并行模拟加速比产生影响。
吴志敏吕慧伟陈明宇
关键词:扩展性BENCHMARK
两级同步:面向众核处理器的并行仿真机制
2013年
针对并行仿真众核处理器计算机过程中同步对仿真器性能、精度的制约问题,提出一种两级同步机制,第一级同步作用于众核处理器片上所有节点间,维持逻辑时间的全局一致性;第二级同步作用于每颗节点内的一级或二级高速缓存与片上网络路由器间,在提升并行性的同时保证处理器内各组件的高精度建模。理论分析给出了两级同步性能的上下界。实验结果表明两级同步具有较好的加速比及合理的可扩展性。
朱小东吴俊敏唐轶轩陈国良隋秀峰
共1页<1>
聚类工具0