您的位置: 专家智库 > >

国家自然科学基金(61170118)

作品数:4 被引量:9H指数:2
相关作者:刘世光刘锦丁锐刘子奇更多>>
相关机构:天津大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 1篇音色
  • 1篇声学
  • 1篇声音
  • 1篇声音传播
  • 1篇声音合成
  • 1篇数据驱动
  • 1篇图像
  • 1篇网络
  • 1篇网络模型
  • 1篇线条
  • 1篇线条画
  • 1篇模态
  • 1篇几何声学
  • 1篇NETWOR...
  • 1篇2D图像
  • 1篇HOURGL...
  • 1篇MODULE
  • 1篇MULTIP...
  • 1篇RESIDU...
  • 1篇ATTENT...

机构

  • 3篇天津大学

作者

  • 3篇刘世光
  • 1篇丁锐
  • 1篇刘锦
  • 1篇刘子奇

传媒

  • 2篇计算机辅助设...
  • 1篇计算机科学
  • 1篇Fronti...

年份

  • 1篇2020
  • 3篇2019
4 条 记 录,以下是 1-4
排序方式:
深度跨模态环境声音合成被引量:3
2019年
随着计算机图形学技术的不断发展,用户对视频及动画的声音质量提出了更高的要求.针对现有方法中存在的算法复杂度高,可扩展性不强等问题,提出一种基于CGAN和SampleRNN的深度学习的环境声音合成算法,采用VGG网络模型提取视频深度特征.并将视频深度特征通过一个时序同步网络模型,实现具有更高同步性的视频到音频的跨模态特征转换;通过音色增强网络模型对合成声音的音色进行增强,以提高网络结构的可扩展性,并得到最终与视频同步的、真实感较强的环境声.通过对音视频跨模态数据集中12类不同类别视频进行训练与测试,结果的主观与客观评价表明,文中算法所生成的结果真实感强,提高了现有算法的可扩展性.
程皓楠李思佳刘世光
Multipath affinage stacked-hourglass networks for human pose estimation被引量:4
2020年
Recently,stacked hourglass network has shown outstanding performance in human pose estimation.However,repeated bottom-up and top-down stride convolution operations in deep convolutional neural networks lead to a significant decrease in the initial image resolution.In order to address this problem,we propose to incorporate affinage module and residual attention module into stacked hourglass network for human pose estimation.This paper introduces a novel network architecture to replace the stacked hourglass network of up-sampling operation for getting high-resolution features.We refer to the architecture as an affinage module which is critical to improve the performance of the stacked hourglass network.Additionally,we also propose a novel residual attention module to increase the supervision of up-sample process.The effectiveness of the introduced module is evaluated on standard benchmarks.Various experimental results demonstrated that our method can achieve more accurate and more robust human pose estimation results in images with complex background.
Guoguang HUALihong LIShiguang LIU
风格线条画生成技术综述被引量:1
2019年
线条画作为一种简单而有效的视觉传达手段,通过突出主要的细节特征,使得人们可以快速地获得主要信息;同时,风格线条画作为一种艺术形式,让人们能够快速欣赏和理解其艺术特征.文中对线条画的生成方法进行了综述与分析.线条画生成技术可以分为基于2D图像的方法与基于3D模型的方法.其中,基于2D图像的线条画生成技术包括样本学习方法、非样本学习的数据驱动方法与非数据驱动方法;基于3D模型的线条画生成技术包括图像空间方法、对象空间方法以及两者的混合方法.通过介绍与分析各种方法并对比分析其优缺点,总结了线条画生成技术现阶段存在的问题及其可能的解决方案,并在此基础上对线条画生成的未来发展趋势进行了展望.
刘子奇刘世光
关键词:线条画2D图像3D模型数据驱动
声音传播模拟技术综述被引量:2
2019年
随着计算机技术的快速发展,虚拟环境中的声音传播模拟技术得到了较大的改进,并广泛应用于虚拟现实中.文中对虚拟环境下声音传播的概念及方法进行系统的分析,首先介绍基于几何声学的传播模拟方法,如虚声源法、射线追踪法、声束追踪法、声辐射度法等,并对声音传播过程中发生的衍射等声学现象进行讨论;然后对波动声学传播模拟方法进行综述,总结了有限元法、边界元法、有限差分时域法、等效源法等常用方法,并讨论了基于波动声学的模拟方法中的指向性声音传播;最后介绍了基于空间-频率分解技术的混合方法,按照现有的评价指标对上述方法进行对比分析,并介绍了非线性介质下的方法拓展;预测了该领域的发展方向,提出基于数据库的研究思路.
丁锐刘锦刘世光
关键词:声音传播几何声学
共1页<1>
聚类工具0