孟猛 作品数:13 被引量:22 H指数:2 供职机构: 中国科学院自动化研究所 更多>> 发文基金: 国家高技术研究发展计划 国家重点基础研究发展计划 中央高校基本科研业务费专项资金 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
基于音素聚类的多语言声学建模方法 被引量:1 2009年 首先提出以音素合并后模型自身似然度下降为距离依据,通过聚类生成多语言通用音素的声学建模方法.在此基础上,比较聚类时增加两种约束条件(同一语种内音素不聚类、不同IPA族的音素不聚类)对性能的影响.同时,对通用音素集的规模对识别性能的影响做了一定探索.最后的实验给出建立中英文双语混合模型在关键词检测系统上的结果,比较4种聚类方法在不同通用音素个数情况下的性能优劣.结果显示,使用本文方法进行一定程度的音素合并,性能比不作聚类直接混合建模有明显提升.适当增加音素聚类的约束,有助于进一步提高性能. 孟猛 梁家恩 徐波关键词:关键词检测 长语音连续识别及识别结果实时反馈方法和系统 本发明公开了一种长语音连续识别及语音识别结果实时反馈的方法及系统。该方法包括:在识别网络中增加句尾结束点到识别起始点的扩展可能性;解码过程中,识别路径在扩展时既可以生成单一句子,也可以生成多个连续句子,通过声学和语言概率... 徐波 孟猛 高鹏文献传递 一种基于互补声学模型的多系统融合语音关键词检测方法 被引量:3 2009年 采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,在等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著性能提升. 孟猛 王晓瑞 梁家恩 徐波关键词:关键词检测 高斯混合模型 神经网络 长语音连续识别及识别结果实时反馈方法和系统 本发明公开了一种长语音连续识别及语音识别结果实时反馈的方法及系统。该方法包括:在识别网络中增加句尾结束点到识别起始点的扩展可能性;解码过程中,识别路径在扩展时既可以生成单一句子,也可以生成多个连续句子,通过声学和语言概率... 徐波 孟猛 高鹏文献传递 基于语音分析与合成的高品质实时变声方法 本发明涉及语音变换技术领域的一种基于语音分析与合成的高品质实时变声方法。在时域上按照时间长度改变的要求对信号进行插值或抽剪,然后变换到频域,对幅度谱和相位谱分别进行处理,分离基频和共振峰,并对其进行独立调节,调节时补偿时... 孟猛 张树武文献传递 基于Multilingual的音素识别及其在语种识别中的应用 被引量:2 2008年 国际上对自动语种识别进行了广泛的研究,提出了各种各样的方法,美国国家标准技术研究所(NIST)多年的评测表明,基于并行音素识别(parallel phoneme recognition language modeling,PPRLM)的方法取得了很好的性能。该文提出了一种基于多种语言的音素识别方法的自动语种识别系统,系统中Multilingual音素集是使用基于数据驱动聚类获得。通过真实环境电话语音测试表明,该方法在只使用了很少的识别时间的情况下,获得了跟传统的PPRLM系统可比的识别正确率。同时经过与PPRLM系统融合后,获得了更好的性能,跟其他主流的几种语种识别方法也有可比的性能。 王士进 孟猛 梁家恩 徐波关键词:信息处理 多语种 音素识别 语种识别 一种用于鲁棒语音识别的语音特征提取方法 本发明公开了一种用于鲁棒语音识别的语音特征提取方法,该方法包括:获取功率谱;采用滤波器组对功率谱进行处理;采用帧平均的方式求取中等时长的功率谱;对功率谱进行不对称滤波处理,同时对功率谱进行掩蔽处理,得到纯净语音功率谱;对... 徐波 范利春 柯登峰 孟猛基于语音分析与合成的高品质实时变声方法 本发明涉及语音变换技术领域的一种基于语音分析与合成的高品质实时变声方法。在时域上按照时间长度改变的要求对信号进行插值或抽剪,然后变换到频域,对幅度谱和相位谱分别进行处理,分离基频和共振峰,并对其进行独立调节,调节时补偿时... 孟猛 张树武文献传递 面向多语言语音识别的声学建模研究 目前语音识别技术在研究和应用领域取得了比较大的进展,但在大多数的使用环境下,都是以单一语种的语音识别为主。而在实际应用中,许多潜在的语音识别任务都需要有多语言的支持。为了提高语音识别系统的应变能力,使语音识别产品的使用人... 孟猛关键词:关键词检测 语音识别 基于Multilingual的音素识别及其在语种识别中的应用 近年来,国际上对自动语种识别进行了广泛的研究,提出了各种各样的方法,NIST多年的评测表明,基于并行音素识别(PPRLM)的方法取得了很好的性能,本文提出了一种基于Multilingual音素识别方法的自动语种识别系统,... 王士进 孟猛 梁家恩 徐波关键词:信息处理 多语种 音素识别 语种识别 文献传递