俞振利
- 作品数:10 被引量:74H指数:3
- 供职机构:浙江大学信息与电子工程学系更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金浙江省教委科研基金更多>>
- 相关领域:电子电信语言文字自动化与计算机技术更多>>
- 基于语音生成逆向解的嘶音合成方法
- 2001年
- 提出了一种应用三质量块声带模型与语音生成逆向映射法相结合的嘶音合成方法 .应用这种方法合成的嘶音信号与实际嘶音信号的实验比较结果表明 。
- 程启明俞振利张礼和
- 基于语音生成和发音模型的语音合成新方法的探讨被引量:6
- 2000年
- 提出基于语音生成模型和发音模型RTLA合成模式实现以共振峰轨迹为目标的语音合成的新方法。该方法采用了基于发音声学原理的反射型传输线模型来实现语音合成器。用于控制合成器的声道面积函数参数由以三个共振峰轨迹为目标的语音生成逆向解获得。该方法不仅可以得到动态过渡和自然度好的合成语音,能够方便灵活地控制或改变语音音色,合成器所需的输入控制参数少,参数更新率低。
- 俞振利程伯中
- 关键词:语音合成
- 从语音信号的有限个共振峰频率估计声道面积参数的一个方法被引量:3
- 1997年
- 本文介绍从语音的有限个共振峰估计声道面积函数模型参数的扰动实现方法.在Schroeder的声管喇叭方程的扰动解法基础上,采用改进的声道面积函数模型;针对不同共振模式之间的交叉影响,采用了交叉敏感扰动矩阵关系式,及交叉扰动敏感矩阵的测试方法.设计了用递归式扰动法实现声道面积参数估计的算法.利用“共振峰─扰动”映射码书作为语音共振峰匹配最佳的初始面积扰动矢量,井用多级扰动目标和自适应增量控制,可有效地实现从有限个语音目标共振峰逆向估计声道面积函数.
- 俞振利张礼和曾尚璀
- 关键词:语音信号处理语音合成低比特率语音编码
- 从任意连续语音中实时提取说话人特征及三维显示
- 1992年
- 本文以最大熵谱法估计得到的多幅浊音的线性预测反射系数矢量序列的长期平均矢量作为说话人特征,定义了特征矢量的平均说话人自差异函数、平均说话人互差异函数和平均说话人互自差异比函数,并对不同说话人特征间的可区分性进行了分析.采用伪彩色编码原理,实现特征矢量的三维显示。设计了PC/AT和TMS 32010组成主从系统,使语音采样和参劲估计同步进行,达到了实时性.实验结果表明,所提取的特征有较好地区分说话人的性能,显示方法。可读性好、易于直观分析和整体观察.系统实时性好.
- 俞振利张礼和
- 关键词:语音说话人特征提取
- 基于Matlab系统的信号FFT频谱分析与显示被引量:46
- 2000年
- 给出一种用 Matlab系统实现信号频谱分析与显示的方法 .Matlab是具有很强的科学计算和图形显示界面的软件系统 .该法可对语音信号 (或其它类型的似平稳信号 )进行基于 FFT的短时频谱分析 ,频谱图的伪彩色映射及显示 .频谱图的类型有宽带和窄带两种 ,伪彩色显示的映射可按需求设置 .文中介绍了基于 FFT频谱分析与频谱图显示的原理 ,Matlab的相关功能函数 ,并给出了一个程序实例及其实验结果 .实验结果表明 ,该法所需的编程简单 ,对设备硬件要求不高 ,易于实现 ,能快速地在普通通用
- 曾尚璀沈华俞振利
- 关键词:信号处理语音信号
- 用矢量码书和动态内插限制方法解决语音生成逆向解的非唯一性问题被引量:2
- 2000年
- 本文研究运用矢量码书和动态内插限制的方法解决语音生成逆向解的非唯一性问题 .表征声道的对数截面积函数的限带傅立叶余弦展开包括了偶次项 ,采用可变声道长度 ;频域声学目标增加了前N个零点频率 ;结合腔包形声学———几何形态映射矢量码书 ,为声学目标匹配得到过渡音的起始和结尾端点的零点与声道长度 ,并用内插方法来限定过渡点的零点频率和声道长度 ,从而解决非唯一性问题 .
- 俞振利程伯中
- 从共振峰到声道面积函数——语音生成逆向问题解的研究
- 本文介绍语音生成逆向问题解,即从语音共振峰逆向解得声道面积函数方法的研究。该方法基于声道对数面积的有限带宽富里叶余弦展开,采用优化的声学——几何映射矢量量化码本和内插技术获得唇端闭合条件下声道的谐振频率,根据声学扰动理论...
- 俞振利曾尚璀刘云海
- 文献传递
- 运用MATLAB Signal Processing Toolbox和GUI技术的语谱分析方法
- 2001年
- 本文介绍一种运用Matlab Signal Processing Toolbox和GUI图形用户界面技术实现语音信号功率谱估计与显的方法,该方法包括基于FFT功率谱估计和Music法功率谱估计等。实验结果表明,该方法编程简单对硬件要求不高,易于实现。
- 俞振利张荧宇等
- 关键词:语音信号处理谱估计谱图MATLAB
- 一种非限定语音说话人实时识别的方法及其实现
- 1990年
- 本文首次使用了最大熵谱法估计的LPC反射系数矢量的长期平均作为说话人的语音特征矢量,利用所定义的特征矢量的平均自差异函数,平均互差异函数及平均互——自差异比函数分析了特征矢量用于非限定语音的说话人识别的有效性和说话人的可区分性;从模式识别分类的Bayes判决准则出发,导出了便于计算和程序实现的简化判决公式——欧几里德空间的加权和距离公式,并利用平均差异函数选择加权系数;提出了用序贯判别法对集外说话人的拒识方法;研制了相应的以微机为核心的实时响应的实验系统,响应速度为3秒。用此系统对20个说话人进行了非限定语音的说话人识别试验,误音率为10.67%,误拒率为5.67%,正确识别率95.41%。
- 俞振利张礼和
- 关键词:语音识别
- 基于TD-PSOLA算法的汉语普通话韵律合成被引量:19
- 2002年
- 结合汉语普通话的韵律特征 ,采用 TD- PSOL A算法实现了汉语普通话的韵律合成 ,并对合成语音和原始语音的韵律参数作了比较分析 .实验结果表明 ,这种方法能够有效地控制语音韵律参数 ,实现较高质量的语音韵律合成 .
- 张后旗俞振利张礼和
- 关键词:语音合成