公共文化服务平台

2025年7月30日星期三

|

欢迎来到佛山市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

谢磊: 作品数：68 被引量：100H指数：6; 供职机构：西北工业大学航海学院更多>>; 发文基金：国家自然科学基金陕西省自然科学基金国家教育部博士点基金更多>>; 相关领域：电子电信自动化与计算机技术理学一般工业技术更多>>

合作作者

孙超西北工业大学航海学院声学工程研...
刘雄厚西北工业大学航海学院
付中华西北工业大学计算机学院陕西省语...
张艳宁西北工业大学计算机学院陕西省语...
蒋冬梅西北工业大学计算机学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

34篇期刊文章
23篇会议论文
8篇专利
2篇学位论文
1篇科技成果

领域

29篇电子电信
19篇自动化与计算...
8篇一般工业技术
8篇理学
7篇天文地球
7篇交通运输工程
1篇经济管理
1篇化学工程
1篇航空宇航科学...
1篇文化科学

主题

32篇语音
14篇语音识别
7篇音频
7篇语音驱动
6篇噪声
6篇浅海
5篇信号
5篇语音识别系统
5篇语音增强
5篇中文
5篇连续语音
5篇连续语音识别
5篇麦克风
5篇海域
4篇语言
4篇声源
4篇水下
4篇浅海波导
4篇连续语音识别...
4篇波束

机构

68篇西北工业大学
3篇工业和信息化...
2篇布鲁塞尔自由...
1篇南洋理工大学
1篇中国科学院
1篇中国人民解放...
1篇微软公司
1篇自然资源部第...

作者

68篇谢磊
23篇孙超
12篇刘雄厚
12篇张艳宁
12篇付中华
10篇蒋冬梅
9篇赵荣椿
5篇赵亚丽
5篇张健
5篇杨玉莲
5篇李冰锋
5篇杨鹏
5篇周祥增
3篇郭祺丽
3篇朱鹏程
3篇郑李磊
3篇樊博
2篇郑鑫
2篇卓颉
2篇明怀平

传媒

7篇物理学报
6篇清华大学学报...
3篇西北工业大学...
3篇声学学报
3篇计算机应用研...
2篇电子与信息学...
2篇中国航空学会...
1篇电子学报
1篇计算机工程与...
1篇计算机工程
1篇计算机应用与...
1篇计算机应用
1篇计算机工程与...
1篇声学技术
1篇中国图象图形...
1篇中国科学：物...
1篇水下无人系统...
1篇2013年全...
1篇第18届全国...
1篇中国声学学会...

年份

5篇2023
3篇2022
2篇2021
2篇2019
4篇2018
3篇2017
4篇2016
1篇2015
3篇2014
7篇2013
2篇2012
11篇2011
5篇2009
1篇2008
1篇2005
4篇2004
3篇2003
4篇2002
1篇2000
1篇1994

共 68 条记录，以下是 1-10

全选清除导出

排序方式：

超高速飞行器脉冲推力矢量控制系统研究: 谢磊李言俊; 关键词：推力矢量飞行控制系统飞行器激光制导超高速导弹

语音驱动说话人头部中的基于决策树的Triseme建模方法: Viseme是在语音驱动说话人头部动画模型中常用的一种音频-视频模型.为了得到更精确的模型就要考虑驱动语音的上下文信息,因此引入了Triseme模型.但是引入Triseme模型后,随着模型数量的急剧增加将导致训练数据的严...; 谢磊蒋冬梅赵荣椿Ilse CravyseHichem SahliJan Conlenis; 关键词：决策树; 文献传递

基于Alize工具包的广播音频播音员自动标注系统: 本文设计与实现了一个基于Alize开源说话人识别工具包的广播音频播音员自动标注系统,对中央电视台《新闻联播》节目主持人以及重要说话人进行自动身份识别、分割与标注。采用Alize工具包提供的Feature Server、M...; 卢咪咪谢磊郑李磊杨玉莲张艳宁; 关键词：说话人识别声纹识别多媒体检索; 文献传递

用于说话人头部动画的Viseme语音识别器: Viseme是在语音驱动说话人头部动画中常用的一种为口形建立的音频-视频模型。本文尝试以viseme为基本HMM模型建立用于说话人头部的语音识别系统。为了得到更精确的模型以提高识别率,引入考虑发音口形上下文的Trisem...; 谢磊蒋冬梅Ilse Cravyse赵荣椿Hichem SahliJan Conlenis; 关键词：决策树; 文献传递

基于NAQ的语音情感识别研究被引量：1: 2008年; 研究了用迭代自适应逆滤波器估计声门激励的方法,以声门激励的时域参数归一化振幅商作为特征,对六种不同情感的连续语音,首先使用F-ratio准则判别其对情感的区分能力,然后运用混合高斯模型对语音情感进行建模和识别。采用eNTERFACE’05情感语音数据库中的语音,比较了以整句NAQ值作为特征和以元音段的NAQ值作为特征,以及主观感知的情感识别结果。实验表明元音段的NAQ值是一种具有判别力的语音情感特征。; 白洁蒋冬梅谢磊付中华任翠红; 关键词：混合高斯模型

基于目标声源方位已知的双麦克风噪声抑制: 复杂噪声抑制是语音技术实用化的基础。很多应用中,目标说话人的方位相对固定,而噪声的类型、个数、位置均是未知的,且可能随时间变化。针对这类应用,该文提出一种基于语音信号时频分布稀疏性的半盲双麦克风噪声抑制方法。首先假定说话...; 张健付中华谢磊赵亚丽; 关键词：语音增强; 文献传递

双麦克风语音增强和杂混模型训练相结合的顽健说话人确认: 赵亚丽付中华谢磊张健张艳宁; 关键词：说话人确认语音增强

实时语音驱动的虚拟说话人被引量：2: 2011年; 该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。; 李冰锋谢磊周祥增付中华张艳宁; 关键词：可视语音合成

基于浅海声强干涉的双水听器运动声源速度估计: 2023年; 针对低信噪比时难以利用低频分析记录谱中宽带连续谱条纹状干涉图样估计声源运动速度的问题,提出一种基于双水听器利用线谱声强干涉起伏估计运动声源速度的方法。该方法利用声源运动参数对时间维线谱声强干涉起伏进行重采样,得到满足正比关系的不同频率线谱声强干涉起伏。通过建立两频率线谱声强干涉起伏之间相关系数的代价函数,搜索出双水听器各自对应的最近通过时间和距速比参数,再结合声源与双水听器的距离位置关系,最终解算出声源运动速度。仿真实验表明,该方法能有效估计声源运动速度,对背景噪声下低速运动声源有较好的测速效果.; 姚远孙超孙超刘雄厚

连续语音识别中声学模型的建立: 该文的工作是中国和比利时的科技合作项目'现实世界的机器视觉和语音技术'的一部分.首要工作是建立一个用语音识别结果驱动的三维人脸(TalkingHead).作者的主要工作是为连续语音识别系统建立声学模型.该文首先介绍了在语...; 谢磊; 关键词：连续语音识别声学模型隐马尔可夫模型上下文相关; 文献传递

全选清除导出

共7页<1 2 3 4 5 6 7>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有：重庆维普资讯有限公司 ©2014－2017，客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张