公共文化服务平台

基于特征加权的应力影响下顽健语音识别方法被引量：5: 2002年; 通过对应力影响下语音数据的分析 ,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感 ,相应的高维特征敏感程度差些。在此基础上 ,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响 ,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验 ,最大相对熵估计方法的识别率可达到 89 9% ,与多重风格训练方法相比 ,识别率提高了 13 1%。; 张磊韩纪庆王承发张文祥; 关键词：应力影响特征加权

一种新的修正Mel频率映射的应力影响下变异语音识别方法: 2002年; Based on the spectrograms analysis and the individual frequency bands of speech under G-force, in this pa-per, a new Mel frequency scale is proposed, and the related MFCC (Mel Frequency Cepstrum Coefficient) is adoptedas the features for recognition of stressed speech under G-force. It is shown from the experiments that the proposedmethod is better than other methods of Mel-based features for stressed speech recognition.; 毕继武韩纪庆; 关键词：变异语音识别语音信号处理

基于MAP自适应算法的应力下变异语音识别方法: 2004年; 变异情况对语音的影响是导致语音识别系统性能下降的原因之一。一般情况下变异语音数据采集困难,获得的训练数据量少,这样即使测试环境和训练环境都相同,识别性能也不理想。利用自适应算法可以解决这类问题,它采用少量的测试环境数据进行训练,以达到训练模型和测试数据匹配的目的,保证系统良好的识别性能。MAP算法是常用的自适应算法,大多应用于话者自适应环境,该文尝试将其应用于变异语音识别系统中,并通过对该模型做相应改进获得了较好的识别结果。在小词表特定人应力变异的识别实验中,分别用非特定人模型和改进的特定人模型作为初始模型,应用MAP算法,系统识别率均有明显提高,与基本识别系统相比,在10遍自适应数据前提下,识别率分别提高了15.84%和15.97%,最好的识别率达到85.56%和90.42%。; 钱芳韩纪庆张磊; 关键词：语音识别变异语音 MAP算法

自然风格言语的汉语句重音自动判别研究被引量：18: 2006年; 重音是语音合成中韵律处理的一个重要参数。本文分析了轻声和重读音节同正常重音在各声学参数上的差异,包括基频、音节时长、强度、停顿长度等,还特别考察了时长同基频参数之间的关系,以及上声音调同基频的关系。建立了基于人工神经网络的三种重音预测模型,即声学预测模型、语言学预测模型和混合预测模型,对汉语句重音(包括轻声、正常重音、重读)进行了自动判别,结果显示混合模型要优于另外两种模型。此外,本文还根据重音标注的多样性现象设计了支持率的评价方法。; 邵艳秋韩纪庆刘挺赵永贞; 关键词：自动判别自然风格声学参数混合模型语音合成基频

声道的调频-调幅模型及其在语音分析中的应用被引量：10: 2002年; 传统的线性声学理论是基于这样一个假设:流经声带的气流在声道中是以平面波的形式传播.而根据Teager的研究结果,由于在声道中有涡流分布,这个假设将不成立.基于这种非线性现象的存在,Maragos提出了一个调频-调幅模型来表示语音产生的过程;近年来这个模型已经被成功地应用到语音处理的许多领域中.介绍了调频-调幅模型的产生背景及其主要理论核心,重点讨论它在语音分析中的应用及在变异语音识别中的应用前景.; 张磊韩纪庆王承发; 关键词：声道调频语音分析 TEAGER能量算子语音信号处理语音识别

一种基于非线性特征的应力影响下变异语音识别方法被引量：3: 2002年; 考虑到变异语音产生的非线性特点,本文提出了一种基于TEO能量算子倒谱特征的应力影响下变异语音识别方法。先将语音信号分割成21个不同频带的信号,然后计算TEO能量,最后进行对数运算和离散余弦变换。对航空模拟飞行器中采集的小词表特定人的识别实验,采用非线性分析的基于TEO能量算子倒谱特征的方法,能有效地提高变异语音的识别性能,比传统的基于MFCC特征的方法识别率提高了11.3％。; 王玉伟张磊韩纪庆; 关键词：语音识别变异语音应力

Study on automatic prediction of sentential stress for Chinese Putonghua Text-to-Speech system with natural style被引量：2: 2007年; Stress is an important parameter for prosody processing in speech synthesis. In this paper, we compare the acoustic features of neutral tone syllables and strong stress syllables with moderate stress syllables, including pitch, syllable duration, intensity and pause length after syllable. The relation between duration and pitch, as well as the Third Tone （T3） and pitch are also studied. Three stress prediction models based on ANN, i.e. the acoustic model, the linguistic model and the mixed model, are presented for predicting Chinese sentential stress. The results show that the mixed model performs better than the other two models. In order to solve the problem of the diversity of manual labeling, an evaluation index of support ratio is proposed.; SHAO Yanqiu HAN Jiqing ZHAO Yongzhen LIU Ting

基于多路差别子空间的语速变化语音的识别被引量：2: 2005年; 语速变化是发音变异的一种,文章建立了快、慢和正常语速的语音库,运用差别子空间方法对语速变化的语音进行了训练和识别,并对其进行了改进,提出了多路差别子空间方法。实验结果表明,该方法对语速变化的语音有良好的识别效果。; 吕成国韩纪庆高文; 关键词：语音识别

基于子空间方法的应力影响下变异语音分类: 2007年; 应力影响下的变异语音是由于说话人受到重力加速度变化而产生的,与正常语音相比,变异语音频谱能量在频带范围内分布更加分散。把整个频带划分成8个子带,采用子带频谱能量的比值为特征,提出一种基于子空间方法的正常/变异语音分类方法。该方法采用CLAFIC方法设计初始向量子空间,并通过LSM算法对两类样本子空间按不同的旋转方式训练,用预分类的结果调整分类器的参数来改善分类器的性能。实验结果表明,该方法对应力影响下的变异语音与正常语音具有良好分类效果,平均分类正确率达到了95.9%。; 吕成国韩纪庆; 关键词：应力

变异语音处理的研究进展被引量：4: 2003年; 本文讨论了变异语音处理技术及其研究进展 ,分析了变异情况对语音识别性能产生的影响 ,综述了变异语音分类和变异语音识别方法 ,探讨了变异语音处理研究中存在的问题及未来的研究重点 .; 张磊韩纪庆王承发; 关键词：变异语音语音分类语音处理

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(60085001)