北京市自然科学基金(4042025)
- 作品数:6 被引量:75H指数:5
- 相关作者:刘文举阮晓钢左国玉刘文举钮心忻更多>>
- 相关机构:中国科学院自动化研究所北京工业大学北京邮电大学更多>>
- 发文基金:北京市自然科学基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 声音转换技术的研究与进展被引量:39
- 2004年
- 声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声音特点 .本文介绍了当前声音转换技术领域的研究状态 ,主要分析现有声音转换技术中各种转换算法的实现原理 ,描述声音转换系统性能的各种评估方法 。
- 左国玉刘文举阮晓钢
- 关键词:声音转换语音频谱码本映射人工神经网络高斯混合模型隐马尔科夫模型
- 基于说话人分类技术的分级说话人识别研究被引量:7
- 2005年
- 识别正确率和抗噪性能固然是说话人识别的研究重点,但识别响应速度也是决定系统实用化的关键所在.本文成功地提出了基于说话人分类技术的分级说话人辨识方法,极大地提高了系统运行速度,随着注册说话人数的增多,较之传统的说话人辨识方法,其优势更加明显.同时在说话人确认中,该方法的使用,进一步提高了确认的正确率,有效地降低了错误接受和错误拒绝率.本文提出的可信度打分方法,也一定程度上改进了系统的性能.实验表明:基于说话人分类技术的说话人辨识方法使系统的运行速度平均提高了3.5倍,对说话人确认等误识率和最小误识率平均下降了53.75%.
- 刘文举孙兵钟秋海
- 关键词:说话人确认
- OMA DRM技术体系研究综述被引量:13
- 2008年
- 为了对最新发布的开放移动联盟(OMA)数字版权管理(DRM)标准的技术体系结构有一个系统全面的认识,积极推动我国DRM标准的制定和数字内容保护技术的应用研究,该文在深入研究最新发布的OMA DRM2.0规范的基础上,对OMA DRM技术体系结构:版权对象获取协议(ROAP)、安全模式、体系结构、内容格式和版权描述语言进行了详细分析,然后从综合角度给出一个系统全面的OMA DRM工作机制:OMA DRM工作流程和原理,最后,对OMA DRM性能做了详细分析:OMA DRM2.0和OMA DRM1.0的主要区别,以及OMA DRM2.0的尚待改进之处。
- 魏景芝杨义先钮心忻
- 关键词:数字版权管理体系结构
- 一种使用声调映射码本的汉语声音转换方法被引量:5
- 2005年
- 在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。
- 左国玉刘文举阮晓钢
- 关键词:声音转换
- 语音转换技术在电话语音识别中的应用研究(英文)
- 2005年
- 提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能。实验数据显示,自适应前由转换语音训练的模型识别率比由纯净语音训练的模型识别率增加了18.9%,而自适应试验表明,由转换语音训练而成的模型在MLLR自适应后,系统识别性能进一步得到改善,识别率增加了5.8%。识别实验表明所提语音转换方法可以减小由于真实电话语料缺乏而造成训练语音和测试语音声学性质的不匹配,从而有效地改善电话语音识别系统的性能。
- 左国玉左国玉刘文举
- 关键词:语音转换语音识别
- 基于后验概率解码段模型的汉语语音数字串识别被引量:12
- 2006年
- 通过对语音解码的分析指出了基于似然概率解码的连续语音识别的局限性,并给出了三种基于后验概率段模型(Segment Model,SM)的语音解码方法.这三种方法成功地运用于随机段模型(Stochastic Segment Model,SSM),使误识率比基线系统下降了11%;与此同时还给出了段模型的快速算法,使算法的计算复杂度降到了与隐马尔可夫模型(Hidden Markov Model,HMM)相同的数量级,满足了实用要求.
- 唐赟刘文举徐波
- 关键词:后验概率语音识别模式识别
- 基于发音稳定段的自适应步长段模型解码及其在LVCSR中的应用
- 本文提出了一种基于发音稳定段的自适应步长段模型解码方法,并将其应用于大词汇量汉语连续语音识别系统中。该方法首先利用语音信号的频谱能量构建特征向量,并用统计分类工具检测出发音稳定段;随后在语音识别阶段,不再对起始帧或终止帧...
- 张华刘文举徐波
- 关键词:语音识别语音信号分析高斯混合模型
- 文献传递