您的位置: 专家智库 > >

谢磊

作品数:68 被引量:100H指数:6
供职机构:西北工业大学航海学院更多>>
发文基金:国家自然科学基金陕西省自然科学基金国家教育部博士点基金更多>>
相关领域:电子电信自动化与计算机技术理学一般工业技术更多>>

文献类型

  • 34篇期刊文章
  • 23篇会议论文
  • 8篇专利
  • 2篇学位论文
  • 1篇科技成果

领域

  • 29篇电子电信
  • 19篇自动化与计算...
  • 8篇一般工业技术
  • 8篇理学
  • 7篇天文地球
  • 7篇交通运输工程
  • 1篇经济管理
  • 1篇化学工程
  • 1篇航空宇航科学...
  • 1篇文化科学

主题

  • 32篇语音
  • 14篇语音识别
  • 7篇音频
  • 7篇语音驱动
  • 6篇噪声
  • 6篇浅海
  • 5篇信号
  • 5篇语音识别系统
  • 5篇语音增强
  • 5篇中文
  • 5篇连续语音
  • 5篇连续语音识别
  • 5篇麦克风
  • 5篇海域
  • 4篇语言
  • 4篇声源
  • 4篇水下
  • 4篇浅海波导
  • 4篇连续语音识别...
  • 4篇波束

机构

  • 68篇西北工业大学
  • 3篇工业和信息化...
  • 2篇布鲁塞尔自由...
  • 1篇南洋理工大学
  • 1篇中国科学院
  • 1篇中国人民解放...
  • 1篇微软公司
  • 1篇自然资源部第...

作者

  • 68篇谢磊
  • 23篇孙超
  • 12篇刘雄厚
  • 12篇张艳宁
  • 12篇付中华
  • 10篇蒋冬梅
  • 9篇赵荣椿
  • 5篇赵亚丽
  • 5篇张健
  • 5篇杨玉莲
  • 5篇李冰锋
  • 5篇杨鹏
  • 5篇周祥增
  • 3篇郭祺丽
  • 3篇朱鹏程
  • 3篇郑李磊
  • 3篇樊博
  • 2篇郑鑫
  • 2篇卓颉
  • 2篇明怀平

传媒

  • 7篇物理学报
  • 6篇清华大学学报...
  • 3篇西北工业大学...
  • 3篇声学学报
  • 3篇计算机应用研...
  • 2篇电子与信息学...
  • 2篇中国航空学会...
  • 1篇电子学报
  • 1篇计算机工程与...
  • 1篇计算机工程
  • 1篇计算机应用与...
  • 1篇计算机应用
  • 1篇计算机工程与...
  • 1篇声学技术
  • 1篇中国图象图形...
  • 1篇中国科学:物...
  • 1篇水下无人系统...
  • 1篇2013年全...
  • 1篇第18届全国...
  • 1篇中国声学学会...

年份

  • 5篇2023
  • 3篇2022
  • 2篇2021
  • 2篇2019
  • 4篇2018
  • 3篇2017
  • 4篇2016
  • 1篇2015
  • 3篇2014
  • 7篇2013
  • 2篇2012
  • 11篇2011
  • 5篇2009
  • 1篇2008
  • 1篇2005
  • 4篇2004
  • 3篇2003
  • 4篇2002
  • 1篇2000
  • 1篇1994
68 条 记 录,以下是 1-10
排序方式:
超高速飞行器脉冲推力矢量控制系统研究
谢磊李言俊
关键词:推力矢量飞行控制系统飞行器激光制导超高速导弹
语音驱动说话人头部中的基于决策树的Triseme建模方法
Viseme是在语音驱动说话人头部动画模型中常用的一种音频-视频模型.为了得到更精确的模型就要考虑驱动语音的上下文信息,因此引入了Triseme模型.但是引入Triseme模型后,随着模型数量的急剧增加将导致训练数据的严...
谢磊蒋冬梅赵荣椿Ilse CravyseHichem SahliJan Conlenis
关键词:决策树
基于Alize工具包的广播音频播音员自动标注系统
本文设计与实现了一个基于Alize开源说话人识别工具包的广播音频播音员自动标注系统,对中央电视台《新闻联播》节目主持人以及重要说话人进行自动身份识别、分割与标注。采用Alize工具包提供的Feature Server、M...
卢咪咪谢磊郑李磊杨玉莲张艳宁
关键词:说话人识别声纹识别多媒体检索
用于说话人头部动画的Viseme语音识别器
Viseme是在语音驱动说话人头部动画中常用的一种为口形建立的音频-视频模型。本文尝试以viseme为基本HMM模型建立用于说话人头部的语音识别系统。为了得到更精确的模型以提高识别率,引入考虑发音口形上下文的Trisem...
谢磊蒋冬梅Ilse Cravyse赵荣椿Hichem SahliJan Conlenis
关键词:决策树
基于NAQ的语音情感识别研究被引量:1
2008年
研究了用迭代自适应逆滤波器估计声门激励的方法,以声门激励的时域参数归一化振幅商作为特征,对六种不同情感的连续语音,首先使用F-ratio准则判别其对情感的区分能力,然后运用混合高斯模型对语音情感进行建模和识别。采用eNTERFACE’05情感语音数据库中的语音,比较了以整句NAQ值作为特征和以元音段的NAQ值作为特征,以及主观感知的情感识别结果。实验表明元音段的NAQ值是一种具有判别力的语音情感特征。
白洁蒋冬梅谢磊付中华任翠红
关键词:混合高斯模型
基于目标声源方位已知的双麦克风噪声抑制
复杂噪声抑制是语音技术实用化的基础。很多应用中,目标说话人的方位相对固定,而噪声的类型、个数、位置均是未知的,且可能随时间变化。针对这类应用,该文提出一种基于语音信号时频分布稀疏性的半盲双麦克风噪声抑制方法。首先假定说话...
张健付中华谢磊赵亚丽
关键词:语音增强
双麦克风语音增强和杂混模型训练相结合的顽健说话人确认
赵亚丽付中华谢磊张健张艳宁
关键词:说话人确认语音增强
实时语音驱动的虚拟说话人被引量:2
2011年
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。
李冰锋谢磊周祥增付中华张艳宁
关键词:可视语音合成
基于浅海声强干涉的双水听器运动声源速度估计
2023年
针对低信噪比时难以利用低频分析记录谱中宽带连续谱条纹状干涉图样估计声源运动速度的问题,提出一种基于双水听器利用线谱声强干涉起伏估计运动声源速度的方法。该方法利用声源运动参数对时间维线谱声强干涉起伏进行重采样,得到满足正比关系的不同频率线谱声强干涉起伏。通过建立两频率线谱声强干涉起伏之间相关系数的代价函数,搜索出双水听器各自对应的最近通过时间和距速比参数,再结合声源与双水听器的距离位置关系,最终解算出声源运动速度。仿真实验表明,该方法能有效估计声源运动速度,对背景噪声下低速运动声源有较好的测速效果.
姚远孙超孙超刘雄厚
连续语音识别中声学模型的建立
该文的工作是中国和比利时的科技合作项目'现实世界的机器视觉和语音技术'的一部分.首要工作是建立一个用语音识别结果驱动的三维人脸(TalkingHead).作者的主要工作是为连续语音识别系统建立声学模型.该文首先介绍了在语...
谢磊
关键词:连续语音识别声学模型隐马尔可夫模型上下文相关
共7页<1234567>
聚类工具0