王晓瑞
- 作品数:2 被引量:3H指数:1
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一个面向广播语音识别的语言模型自适应框架
- 2007年
- 语言模型自适应的目的是减小模型与识别任务之间的语言差异。这些差异包括词典差异、风格和内容差异以及模型的概率分布差异。本文提出一种新的非迭代的中文新词提取方法和一种新的开放式词典的中文语言模型。基于这些技术,本文提出一个面向广播语音识别的语言模型自适应框架,该框架联合了以下技术:一种新的非迭代的新词提取方法,一种新的中文开放式词典语言模型,一种基于困惑度(PPL)的背景语料筛选方法和一个N-gram概率分布自适应模块。另外,本文还专门分析了在语言模型自适应过程中命名实体词的识别情况。实验表明,通过使用该框架,误识率相对下降了10%,实体词识别准确率提高了4%。
- 王晓瑞丁鹏梁家恩徐波
- 关键词:计算机应用中文信息处理
- 一种基于互补声学模型的多系统融合语音关键词检测方法被引量:3
- 2009年
- 采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,在等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著性能提升.
- 孟猛王晓瑞梁家恩徐波
- 关键词:关键词检测高斯混合模型神经网络