搜索到389篇“ 汉语连续语音“的相关文章
基于改进卷积神经网络的汉语连续语音识别方法
2023年
根据当前的识别需求及标准,提取语音识别基元,采用多目标的方式,提高识别的效率,布设交叉多目标识别矩阵,同时改进卷积神经网络连续语音识别模型,采用动态识别规整完成语音识别处理。测试结果表明,与传统面向健壮自动汉语连续语音识别测试组和传统基于改进多带谱减汉语连续语音识别测试组相比,所设计的改进卷积神经网络汉语连续语音识别测试组语音误识率被较好地控制在20%以下,说明在改进卷积神经网络的辅助下,语音识别效果明显改善,针对性更强,具有实际的应用价值。
高适金宇黄宇
关键词:汉语语音连续语音语音识别识别方法
汉语连续语音切分技术研究
2020年
汉语连续语音切分的准确性,是影响汉语语音识别率的重要因素之一。连续语音切分是汉语语音识别的重要基础,论文介绍了汉语语音切分技术的基本原理,综合利用端点检测、基音周期轨迹、语谱图等特征,研究了一种汉语语音切分的算法。实验表明该算法能有效提高汉语连续语音切分的准确率。
王宇琛张二华
关键词:端点检测语谱图
噪声环境下汉语连续语音声调识别研究
汉语不同于英语的一种语音,最显著的差别在于语调,汉语是个有调语言,而英语中并不存在调一说。因此声调成为了汉语一个非常重要的特征,并运用到许多语音研究领域,比如语音合成,语音识别,以及语音编码。本文我们研究对象是标准普通话...
刘从桂
关键词:连续语音声调识别语音增强噪声环境
文献传递
基于HTK的汉语连续语音识别研究
自动语音识别(ASR,Automatic Speech Recognition)是通过机器识别和理解过程,把人类的语音信号转变为相应的文本或命令的技术。语音识别技术是一门综合技术,融合声学、语音学、语义学、信号处理、心理...
何金鑫
关键词:隐马尔科夫模型自动语音识别
文献传递
一种新的汉语连续语音声调评测算法被引量:1
2013年
提出一种新的连续语音的声调评测算法,该算法可应用于计算机辅助语言学习系统和普通话水平测试中的声调评测。考虑到连续语音声调受上下文之间的相互影响,采用三音节单元建立高斯混合模型(Gaussian Mixture Model,GMM),三音节中辅音部分用Spline插值法拟合声调曲线来反映音节间基音频率的转移信息,并利用Fujisaki模型去除语句的语调和说话人个性特征,只对基频曲线中的声调特征建模。实验结果显示,相比于传统方法,采用三音节Spline插值和Fujisaki改进特征的方法使得机器与人工打分的相似度在测试集中分别提高了8.75%和14.09%。
沈彩凤俞一彪
关键词:连续语音高斯混合模型
汉语连续语音识别系统中三音子模型的优化被引量:4
2013年
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
齐耀辉潘复平葛凤培颜永红
关键词:三音子模型最大后验概率
基于Seneff听觉谱特征的汉语连续语音声韵母边界检测被引量:6
2012年
提出了一种基于声韵母能量分布和共振峰结构特性的汉语连续语音声韵母边界检测方法。该方法首先将语音经过Seneff听觉感知模型得到听觉谱,然后基于听觉谱,选取全频带能量、低频带能量、谱重心、高低频能量比、中高频能量等特征参数对各声韵母类别能量分布和共振峰结构特性进行描述,最后根据特征参数变化剧烈的点确定出声韵母边界,并采用包络的一阶差分和基于样点的Kullback-Leibler距离对得到的边界进行修正。实验结果表明,对8 kHz采样的语音边界检测准确率可达到93.7%;信噪比10dB的语音边界检测准确率可达到85.3%以上;经过参数编码后语音边界检测准确率可达86 7%以上。
陈斌张连海王波屈丹
关键词:汉语连续语音谱特征韵母结构特性
汉语连续语音声韵母类别属性检测技术研究
基于隐马尔可夫模型(HMM)的语音识别是主流的大词汇量语音识别方法,但是该方法没有考虑人的思维认知过程,忽略了很多语音及语言学知识,目前发展遇到了瓶颈。因此,一个以知识为基础并结合统计模型的新型语音识别框架应运而生。而语...
陈斌
关键词:连续语音识别
文献传递
基于HTK的汉语连续语音识别系统的设计与实现
语音识别最直接的目的是让计算机听懂人说的话。经过半个多世纪的发展,语音识别理论已趋近成熟。大量的实验结果和实践操作证明,目前很多语音识别算法和识别模型非常有效。语音识别技术己被广泛应用于各行各业中。本文主要探究了语音识别...
饶耀全
关键词:模式识别端点检测特征参数
基于元音检测的汉语连续语音声韵母分割被引量:7
2011年
在基于声韵母的汉语连续语音识别中,声韵母基元的准确分割是非常重要的一步。当前的声韵母分割方法在非连续语音中分割准确度较高,但在连续语音中准确度大幅度降低。利用熵与汉语元音的共振峰能量设计了一种新的分割方法,并引入重叠分割策略,完整地分割出汉语连续语音中的声韵母基元。实验结果表明,这种分割方法在低信噪比下也有很高的分割正确率。
王艳冯宏伟张利平忽满利
关键词:连续语音识别

相关作者

王作英
作品数:184被引量:518H指数:11
供职机构:清华大学信息科学技术学院电子工程系
研究主题:语音识别 语言模型 连续语音识别 语音 汉语
赵力
作品数:552被引量:1,676H指数:19
供职机构:东南大学
研究主题:语音情感识别 语音情感 情感识别 语音 语音信号
吴镇扬
作品数:222被引量:961H指数:17
供职机构:东南大学
研究主题:语音识别 隐马尔可夫模型 声源定位 粒子滤波 语音信号
黄泰翼
作品数:82被引量:190H指数:8
供职机构:中国科学院自动化研究所
研究主题:语音识别 汉语 语音 元音识别 神经网络
邹采荣
作品数:272被引量:1,092H指数:19
供职机构:南京工程学院
研究主题:助听器 语音识别 人脸识别 语音信号 数字助听器