葛凤培
- 作品数:17 被引量:33H指数:4
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信语言文字文化科学更多>>
- 一种语音激活方法及系统
- 本发明涉及一种语音激活方法,包括:建立声学模型,在声学模型基础上建立解码网络空间;按照噪声环境等级选择对应的静音抑制配置参数,将输入语音流切分成语音片段;提取语音片段的语音特征;将语音特征输入解码网络空间进行解码识别,获...
- 葛凤培
- 文献传递
- 具有选择注意能力的语音拾取技术被引量:4
- 2015年
- 随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以及同时存在的其他声源等.如果不采用近讲的拾音方式,那么这些因素都会对传播中的语音声波造成干扰.特别是当多个语音系统和多个说话人处于同一环境时,如何确保系统正确接收语音信息,决定了语音系统能否走向实用.本文参考人类的听觉注意机理,提出充分利用对目标语音及干扰声源的先验知识,检测和提升目标语音,并通过将传声器阵列、语音唤醒、目标语音检测、语音增强、混响抑制等一系列技术相结合,实现抗干扰的目标语音拾取.
- 王晓飞国雁萌葛凤培吴超付强颜永红
- 关键词:传声器阵列语音增强
- 针对少数民族的汉语发音质量评估系统研究
- 在计算机辅助语言学习系统中,不同音素间的声学混淆现象严重影响发音质量评估的准确性。特别是对少数民族地区学习者来说,地方口音更会加剧这种声学混淆的严重性。为解决这一难题,本文提出了一种新颖的精细音子串联的汉语音节结构来对声...
- 葛凤培潘复平董滨颜永红
- 关键词:计算机辅助语言学习语音识别
- 文献传递
- 一种语音激活方法及系统
- 本发明涉及一种语音激活方法,包括:建立声学模型,在声学模型基础上建立解码网络空间;按照噪声环境等级选择对应的静音抑制配置参数,将输入语音流切分成语音片段;提取语音片段的语音特征;将语音特征输入解码网络空间进行解码识别,获...
- 葛凤培
- 汉语发音质量评估的实验研究被引量:13
- 2010年
- 研究了发音评估系统中通用的置信度测度——后验概率算法,针对它存在的不足,提出了两种改进方案。首先,为了降低计算复杂度,传统算法采用了求最大值算法代替求和算法,在被测发音偏离目标音素集的情况下,这会严重降低后验概率的计算精度,本文提出基于扩展的音素混淆网络的后验概率算法。其次,为使置信度能评估不同语音段长的发音质量优劣,传统算法采用了后验概率的段长规整策略,研究分析发现声学似然值与时间的关系更为紧密,所以本文提出了基于声学似然值的时间规整方案。试验结果表明:与传统算法相比,采用改进的置信度算法能使平均打分错误率相对降低35%左右,有效地改善了计算机辅助语言学习系统的性能。
- 葛凤培潘复平董滨颜永红
- 关键词:发音汉语语言学习系统后验概率
- 香港普通话水平考试(PSK)单双音节朗读自动评测系统
- 董滨潘复平刘常亮葛凤培
- 香港普通话水平考试(PSK)单双音节朗读自动评测系统,可以自动为口语考试进行评分,以解决人工评分不可避免的主观性和人工评测员劳动强度大等问题。
- 关键词:
- 关键词:普通话
- 一种婴儿哭声检测方法及装置
- 本发明涉及一种婴儿哭声检测方法及装置,包括:对预获取的样本训练集中的语音数据进行感知线性预测系数PLP特征提取,获取与样本训练集中的语音数据对应的语音特征;利用深度神经网络算法,对样本训练集中的语音数据和与语音数据对应的...
- 葛凤培张少甫颜永红
- 文献传递
- 针对少数民族的汉语发音质量评估系统研究
- 在计算机辅助语言学习系统中,不同音素间的声学混淆现象严重影响发音质量评估的准确性。特别是对少数民族地区学习者来说,地方口音更会加剧这种声学混淆的严重性。为解决这一难题,本文提出了一种新颖的精细音子串联的汉语音节结构来对声...
- 葛凤培潘复平董滨颜永红
- 关键词:计算机辅助语言学习语音识别
- 文献传递
- 基于DNN的声学模型自适应实验被引量:5
- 2015年
- 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能.
- 张宇计哲万辛张震葛凤培颜永红
- 关键词:语音识别
- 一种基于音素混淆网络的音素后验概率计算方法
- 本发明提供一种基于音素混淆网络的音素后验概率算法,包括:预处理分帧;提取每帧语音的语音特征;根据全音节循环网络状态图、声学模型和语音特征向量进行解码,得到最优路径上的各音素分割点信息;在各个音素段内,搭建其对应的音素混淆...
- 葛凤培颜永红
- 文献传递