张雪英
- 作品数:229 被引量:811H指数:13
- 供职机构:太原理工大学信息工程学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:电子电信自动化与计算机技术矿业工程文化科学更多>>
- 情感语音的非线性动力学特征被引量:14
- 2016年
- 基于语音发声过程中的混沌特性,提出了非线性动力学模型与情感语音信号处理相结合的方法.提取了该模型下情感语音的非线性特征:最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和Hurst指数.设计情感语音识别对比实验以验证非线性特征性能.首先,选用德国柏林语音库和自主录制的TYUT2.0情感语音数据库中的3种情感(高兴、悲伤和愤怒)作为实验数据来源;其次,分别提取非线性特征、韵律特征和梅尔频率倒谱系数特征,采用支持向量机进行了情感识别.结果表明,非线性特征在柏林数据库实验中的识别率高于韵律特征识别率,但是略低于梅尔频率倒谱系数特征识别率,验证了非线性特征是一组区分情感的有效特征;在TYUT2.0数据库中的识别率均高于韵律特征和梅尔频率倒谱系数特征的识别率,在语料真实度和自然度更高的TYUT2.0数据库中识别结果相对更高,鲁棒性更好.
- 姚慧孙颖张雪英
- 关键词:动力学模型
- 基于KELM决策融合的语音情感识别
- 2017年
- 针对语音情感信号的复杂性和单一分类器识别的局限性,提出一种核函数极限学习机(KELM)决策融合的方法用于语音情感识别。首先对语音信号提取不同的特征,并训练相应的基分类器,同时将输出转化为概率型输出;然后利用测试集在基分类器的输出概率值计算自适应动态权值;最后对各基分类器的输出进行线性加权融合得到最终的分类结果。利用该方法对柏林语音库中4种情感进行识别,实验结果表明,提出的融合KELM方法优于常用的单分类器以及多分类器融合方法,有效地提高了语音情感识别系统的性能。
- 张雪英张乐孙颖张卫
- 关键词:语音情感识别概率矩阵
- 12.8kbit/s LD-CELP语音编码算法及实时实现
- 该文以G.7228语音编码标准为基础,通过对码书中码字使用频率进行统计试验,找到了一种有效的降低码书体积的方法,从而提出一个12.8kbit/s LD-CELP语音编码算法。实验表明,该方法与同类方法相比,可保持相对好的...
- 张雪英
- 关键词:语音编码DSP系统矢量量化数据压缩
- 文献传递
- 基于SVM的语音信号情感识别被引量:2
- 2012年
- 在智能人-机交互系统中,语音信号的情感分类是目前热点的研究领域,并且得到了广泛的应用。本文提出一种基于特征提取和借助支持向量机(support vector machine,SVM)分类器(classifier)的情感互相关性的方法,并应用于情感语音识别。利用这种方法对3种情感语音信号进行情感分类。SVM分类器是利用情感语音信号中情感互相关性的特征提取进行分类的。这种通过SVM分类器的情感互相关性的自动分类方法,可以将情感识别率大幅提高,并且在识别愤怒情感时的准确率可以达到95.04%。
- 秦宇强张雪英
- 关键词:语音情感识别
- 不同情感语音韵律参数间的曲线回归分析
- 2014年
- 韵律特征分析是情感语音研究的重要组成部分。为了更好地预测高兴(积极)以及生气(消极)情感的韵律特征参数和平静(中性)情感参数间的非线性关系,利用曲线回归分析方法对韵律特征参数的统计特性进行了深入研究。并将语音库中的情感语句分为句首、句中、句末三部分分别做研究,将结果与整体间做比较。实验结果表明各韵律参数之间的非线性关系大致相似,为接下来的情感语音研究提供了良好的基础。
- 刘星星张雪英孙颖
- 关键词:情感语音非线性
- MiniGUI在基于OMAP5912开发板上的移植被引量:2
- 2009年
- 随着嵌入式系统的发展,用户对嵌入式系统的要求越来越高,其中用于实现人机交流功能的嵌入式GUI成为研究中的一个重点,拥有广阔的应用前景。详细介绍了MinGUI的移植、使用方法,说明了交叉编译环境建立的过程、移植MiniGUI所需的库和资源文件及其作用、MiniGUI运行环境的配置。最终实现了对具有双核结构的OMAP5912开发板的界面支持,完成了构建嵌入式图形界面系统的前期工作,取得了很好的实验效果。
- 金刚张雪英
- 关键词:MINIGUI图形用户界面
- 结合语音融合特征和随机森林的构音障碍识别被引量:8
- 2018年
- 为分析病理人群与正常人群的发音差异性,提出一种结合语音融合特征和随机森林的语音识别方法来进行正常语音与构音障碍语音的分类识别,从而为医学诊断和治疗提供科学和客观的依据.首先,使用多伦多大学开发的病理语音数据库,提取出语音的五种韵律特征以及梅尔频率倒谱系数,再计算其统计特征,构成融合特征,最后结合随机森林算法进行分类识别.结果显示,相比于单一类型特征,提出的融合特征在识别性能上有着显著优化作用,与随机森林分类器结合后,对于男性声音的分类准确率达到99.21%,对于女性声音的分类准确率达到98.97%,综合分类准确率达到98.00%.同时研究还发现,相较于句子,患者对短语的发音更为准确.
- 李东张雪英段淑斐闫密密
- 关键词:韵律特征
- 基于信号能量的浊语音盲信号分离算法被引量:2
- 2015年
- 针对以往单声道浊语音分离算法对目标语音信号分离不稳定性和信噪比低的不足,引入了浊语音的另一个重要特征,即信号能量。提出了一种基于信号能量的浊语音分离算法,算法对经典的Hu-Wang算法进行了改进,将能量特征应用于听觉重组部分,通过能量特征来改进目标语音听觉流的重组性能,降低噪声对重组后的目标听觉流的干扰,提高算法的稳定性。实验结果表明:与Hu-Wang算法相比较,该改进算法可提高目标语音的分段信噪比,改善了目标浊语音的分离性能。
- 李鸿燕屈俊玲张雪英
- 关键词:通信技术计算听觉场景分析语音分离
- 支持向量机语音识别算法在DM6446上的实现被引量:1
- 2012年
- 针对语音识别系统对实时性和便携性的要求,提出一种基于MFCC/SVM在DM6446嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统,将有向无环图多类分类支持向量机算法移植到该平台。并在该平台用DAG方法对非特定人孤立词和连接词进行语音识别,比隐马尔可夫模型有明显优势。通过样本预选取算法对训练样本进行预选取处理,并且应用到嵌入式语音识别系统中,大大降低了训练时间和测试时间。
- 牛砚波张雪英刘晓峰
- 关键词:支持向量机DM6446多类分类语音识别
- 听障学生和健听学生鼻韵母声学及运动学的分析研究被引量:5
- 2018年
- 本研究通过分析听障学生和健听学生普通话鼻韵母的声学和运动学数据,探讨其发音数据差异及不同发音特征间的关系。利用三维电磁发音仪采集14名听障学生和10名健听学生的鼻韵母发音数据,排除其中4名发音错误率较高的听障学生的数据不予分析,然后采用语音学软件和数据处理软件分别提取鼻韵母的声学数据和运动学数据,对试验数据作t检验及相关性分析。试验结果表明,与健听学生相比,听障学生的第一共振峰频率(F1)、第二共振峰频率(F2)、舌位以及声学—运动学关系在不同音值下的差异具有统计学意义(P<0.05或P<0.01);听障学生/en/和/eng/所得垂直运动数据—F1关系与健听学生相同。本文研究结论或可为听障患者康复训练提供指导依据,帮助听障患者提高发音准确率。
- 王晴白静薛珮芸张雪英冯沛
- 关键词:听障学生鼻韵母