段淑斐
- 作品数:19 被引量:11H指数:2
- 供职机构:太原理工大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学电气工程更多>>
- 结合语音融合特征和随机森林的构音障碍识别被引量:8
- 2018年
- 为分析病理人群与正常人群的发音差异性,提出一种结合语音融合特征和随机森林的语音识别方法来进行正常语音与构音障碍语音的分类识别,从而为医学诊断和治疗提供科学和客观的依据.首先,使用多伦多大学开发的病理语音数据库,提取出语音的五种韵律特征以及梅尔频率倒谱系数,再计算其统计特征,构成融合特征,最后结合随机森林算法进行分类识别.结果显示,相比于单一类型特征,提出的融合特征在识别性能上有着显著优化作用,与随机森林分类器结合后,对于男性声音的分类准确率达到99.21%,对于女性声音的分类准确率达到98.97%,综合分类准确率达到98.00%.同时研究还发现,相较于句子,患者对短语的发音更为准确.
- 李东张雪英段淑斐闫密密
- 关键词:韵律特征
- 一种基于GIS技术的煤矿突水预警方法
- 一种基于GIS技术的煤矿突水预测系统,所述系统包括一个或多个客户端、无线传感器终端和PC机输入端;以及GIS子系统和数据库服务器与无线传感器终端和PC机输入端连接,以存储各种实时信息;无线传感器终端和PC机输入端将现场监...
- 李凤莲张雪英陈桂军黄丽霞李文杰李智勇段淑斐
- 文献传递
- 基于多任务自适应知识蒸馏的语音增强
- 2024年
- 【目的】提出一种多任务自适应知识蒸馏的语音增强算法,旨在解决复杂模型在时间和硬件等计算成本方面带来的问题,同时提高语音增强算法的性能。【方法】首先,采用知识蒸馏的思想来解决现有的语音增强模型过于庞大、参数多造成计算成本上升问题;其次,充分考虑不同时频单元之间的差异,引入加权因子来优化传统损失函数提升学生网络性能;为了避免教师网络预测的不确定性影响学生网络的性能,构建多任务自适应学习的知识蒸馏网络,可以更好地利用不同任务之间的关联性优化模型。【结果】实验仿真结果表明,所提出的算法在减少参数量、缩短计算时间的同时,还能有效提高语音增强模型的性能。
- 张刚敏李雅荣贾海蓉王鲜霞段淑斐
- 关键词:语音增强
- 通用型自动物种识别算法的对比研究
- 2016年
- 在大数据时代,通用型自动物种识别算法的研究对于算法的共享性及可扩展性至关重要。Raven和Song Scope作为通用型自动识别算法的先驱,虽然被广泛使用,但是没有采用实时现场监测数据进行深入的对比研究。在细致挖掘Raven和Song Scope设计原理的基础上,提出时间概率自动机TPA(Timed and Probabilistic Automata),并对Raven、Song Scope和TPA进行了实验对比研究。结果表明,与Raven和Song Scope相比,TPA的平均准确率、回溯率及精确度均提高了大约20%.
- 段淑斐张雪英ZHANG Jinglan
- 关键词:声音识别
- 一种构音障碍发音运动异常分布的统计分类方法
- 本发明属于信息处理技术领域,具体是一种构音障碍发音运动异常分布的统计分类方法。解决了构音器官发音运动统计的问题,包括以下步骤,S100~绘制舌尖、舌中、舌根在前后、左右、上下三方向发音运动区间的分布图;S200~以25m...
- 段淑斐张雪英闫密密
- 一种基于GIS技术的煤矿突水预警方法
- 一种基于GIS技术的煤矿突水预测系统,所述系统包括一个或多个客户端、无线传感器终端和PC机输入端;以及GIS子系统和数据库服务器与无线传感器终端和PC机输入端连接,以存储各种实时信息;无线传感器终端和PC机输入端将现场监...
- 李凤莲张雪英陈桂军黄丽霞李文杰李智勇段淑斐
- 一种特征增强的构音障碍语音处理方法
- 本发明属于语音信号处理技术领域,具体涉及一种特征增强的构音障碍语音处理方法,包括以下步骤:S1、对原始信号进行快速傅里叶变换,计算得到其频谱信号;S2、对频谱信号进行经验模态分解,得到各个本征模式分解分量;S3、计算前m...
- 段淑斐朱婷张雪英卡米拉孙颖贾海蓉
- 一种NiO/H-TiO<Sub>2</Sub>纳米管复合电极的制备方法
- 本发明公开了一种基于TiO<Sub>2</Sub>纳米管电化学改性及其复合电极制备的方法,具体为阳极氧化法、电化学还原法以及差分脉冲法相结合制备TiO<Sub>2</Sub>纳米管阵列,再进行改性、沉积电极材料从而制备高...
- 李刚郭丽芳李廷鱼段淑斐王开鹰孙雅静赵清华李朋伟胡杰张文栋
- 文献传递
- 普通话多模态情感语音数据库构建与评测
- 2024年
- 本文设计并建立了一个包含发音运动学、声学、声门和面部微表情的多模态情感语音汉语普通话数据库,分别从语料设计、被试选择、录制细节和数据处理等环节进行了详细的描述,其中信号被标记为离散情感标签(中性、愉悦、高兴、冷漠、愤怒、忧伤、悲痛)和维度情感标签(愉悦度、激活度、优势度)。本文对维度标注的数据进行统计学分析,验证标注的有效性,同时验证标注者的SCL-90量表数据并与PAD标注数据结合后进行分析,探究标注中存在的离群现象与标注者心理状况之间的内在联系。为验证该数据库的语音质量和情感区分度,本文使用SVM、CNN、DNN3种基础模型计算了7种情感的识别率。结果显示,单独使用声学数据时7种情感的平均识别率达到了82.56%;单独使用声门数据时平均识别率达到了72.51%;单独使用运动学数据时平均识别率也达到了55.67%。因此,该数据库具有较高的质量,能够作为语音分析研究的重要来源,尤其是多模态情感语音分析的任务。
- 李良琦张雪英段淑斐肖仲喆贾海蓉梁慧芝
- 一种基于情感维度下的深度情感交互模型的构建方法
- 本发明属于情感识别、模式识别等领域,具体是一种基于情感维度下的深度情感交互模型的构建方法。解决了克服传统的情感模型只能对情感状态出现的概率进行描述而忽略情感本身的相互关联的问题,包括以下步骤:S100~针对实验室现有的情...
- 孙颖张雪英马江河王少玄贾海蓉段淑斐