教育部科学技术研究重点项目(03082)
- 作品数:19 被引量:135H指数:5
- 相关作者:赵力邹采荣吴镇扬王治平包永强更多>>
- 相关机构:东南大学江苏信息职业技术学院云南交通职业技术学院更多>>
- 发文基金:教育部科学技术研究重点项目国家自然科学基金面向21世纪教育振兴行动计划更多>>
- 相关领域:电子电信理学一般工业技术自动化与计算机技术更多>>
- 分数傅里叶变换域上含噪语音的联合滤波被引量:4
- 2006年
- 噪声是影响语音识别和说话人识别性能的主要因素,目前常用的降噪方法多是针对平稳噪声的,而针对非平稳噪声的降噪方法很少。而在实际环境中,通常的噪声是非平稳的。本文将含噪语音变换到分数傅立叶域上,提出了一种在分数傅立叶变换域上进行线性最优滤波和中值滤波的联合滤波降噪方法。实验结果表明,该方法对含非平稳噪声的语音的降噪效果明显优于维纳滤波,能够有效地降低非平稳噪声的影响,提高非平稳噪声环境下的语音识别和说话人识别性能。
- 包永强赵力邹采荣
- 关键词:语音增强分数傅里叶变换
- MDCT变换在AAC中的应用
- 2005年
- 1引言
变换压缩编码是一种高效的频域编码技术.在标准化组织ISO/IEC制定的音频编码标准中普遍在常用的离散余弦变化的基础上使用了一种改进的余弦变换MDCT.这种变换有利于消除边界噪卢,改善了信号的质量,但是提高了计算的复杂度,需要快速算法对其进行优化.
……
- 陈卉严鹏赵力邹采荣
- 基于时间规整网络的GMM说话人识别模型的初始化方法
- 2005年
- 1前言
对于与文本无关的说话人识别,一般采用混合高斯模型(Gaussian Mixture Model:GMM)[1,2]来进行识别,在训练GMM模型之前,模型的初始参数必须首先确定.初始化模型参数的有效方法是对训练数据进行分段,训练数据语音帧根据其特征分到M个不同的类中(M为混合数的个数),与初始的M个高斯分量相对应.每个类的均值和方差作为模型的初始化参数.
……
- 沈忱章明赵力邹采荣
- 语音识别在EWB电路基础实验教学中的应用
- 2005年
- 1引言
在电类专业职业人才的培养过程中,实验教学在教学中的地位更是举足轻重的.但是目前职业学校电类专业的实验教学中普遍存在实验室管理落后、资金不足,实验室投入不够、实验手段和方法落后等问题[1].本文研究了利用语音控制的EWB技术,构建起一种基于计算机工作平台的新型电类专业电路基础实验教学模式.该系统可以重新组织实验教学过程,充分利用职业学校的计算机资源,最大限度地发挥计算机在电类专业实验教学中的作用.
……
- 邓金星赵力邹采荣
- 噪声环境下语音识别方法的研究
- 2005年
- 1引言
语音识别的性能常常与环境背景噪声等的干扰有密切关系A[1],这些都是语音识别的识别率得不到进一步提高的主要因素.
……
- 商敏红赵力邹采荣
- 基于连续状态HMM的汉语语音识别方法
- 2005年
- 1引言
现在隐马尔可夫模型(HMM)已成为语音信号处理的重要方法被广泛地应用到语音识别等领域[1,2].然而由于传统的HMM在每个状态处理的各帧语音信号都与前后的时间顺序无关,所以影响了HMM描述语音信号时间相关等动态特性的能力,降低了语音识别的性能[3].针对这个问题,本文提出了连续状态HMM的设想.
……
- 曹建林郭午阳赵力邹采荣
- 基于VQ和HMM的语音识别系统的性能比较
- 2005年
- 1前言
语音识别代表性的方法有矢量量化法(VQ)和隐马尔可夫模型法(HMM).VQ法是由Shore和Burton首先提出[1],其主要优点是无需时间规正或进行动态时间伸缩.但是,该方法对于由话者差别引起的语音特征的变化却无能为力.HMM方法则适合于非特定人语音识别系统,因为它作为统计模型能够吸收由不同说话人引起的语音特征的变化[2].本文以语音信号的LPC倒谱系数和差值倒谱系数的混合特征参数作为识别的特征矢量集,比较了利用矢量量化(VQ)和各态经历隐马尔可夫模型(HMM)[3]技术实现的孤立字词语音识别系统的性能.结论是各态经历HMM的识别性能好于VQ的识别性能.
……
- 曾昭才赵力邹采荣
- SirenTM(G722.1)算法实现及DSP代码优化
- 2005年
- 1引言
本文主要介绍低码率宽带语音编码SirenTM(G722.1)算法实现及其在TMS320C64X系列DSP的实现和优化.重点介绍了SirenTM(G722.1)算法流程、其关键技术MLT(重叠调制变换),DSP的主要优化方法,及本项目中算法的实现性能,给出了测试结果和运算复杂度等.
……
- 曹维娜赵力邹采荣
- 第三代移动通信中语音传输的编码技术
- 2005年
- 1引言
信道编码技术是移动通信中提高系统传输数据可靠性的有效方法,主要是降低信号传播功率和解决信号在无线传播环境中不可避免的衰落问题.在第二代移动通信系统中应用卷积编码和交织,对保证话音和低速数据业务的业务质量(QoS)有很好的效果.第三代系统在第二代的基础上,所需提供的业务种类大大增加,这就对信道编码提出了更高的要求.但对于低速率的语音传输来说,仍然采用了卷积编码和交织.
……
- 陆益仇卉赵力邹采荣
- 全局和时序结构特征并用的语音信号情感特征识别方法被引量:17
- 2004年
- 在利用全局特征进行语音情感特征分析的基础上,提出了采用情感语句中各元音时序结构作为新的特征,并针对不同语句中包含不同元音个数的情况,提出了零补齐、全局均值补齐、前均值补齐三种不同的规整方法.以从10名话者中搜集的带有欢快、愤怒、惊奇、悲伤4种情感的1000句语句作为样本,本文对语音情感特征进行了分析.实验结果表明利用全局特征和时序特征相结合,对时序特征采用前均值补齐,同时使用修正二次判别函数(MQDF)进行情感识别能够获得94%的平均情感识别率.
- 赵力王治平卢韦邹采荣吴镇扬
- 关键词:语音信号情感识别