您的位置: 专家智库 > >

国家自然科学基金(11161140319)

作品数:24 被引量:61H指数:5
相关作者:颜永红王晶许春冬李军锋潘接林更多>>
相关机构:中国科学院北京理工大学江西理工大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
相关领域:电子电信自动化与计算机技术交通运输工程建筑科学更多>>

文献类型

  • 18篇期刊文章
  • 4篇会议论文

领域

  • 18篇电子电信
  • 2篇自动化与计算...
  • 1篇交通运输工程
  • 1篇医药卫生
  • 1篇语言文字

主题

  • 10篇语音
  • 4篇语音增强
  • 3篇语音识别
  • 2篇信号
  • 2篇序贯
  • 2篇回声消除
  • 1篇多输出
  • 1篇多输入多输出
  • 1篇多特征融合
  • 1篇信号盲检测
  • 1篇性能分析
  • 1篇音符
  • 1篇音节
  • 1篇音乐
  • 1篇音频
  • 1篇音频编解码
  • 1篇隐马尔可夫模...
  • 1篇英语
  • 1篇英语口语
  • 1篇英语口语考试

机构

  • 13篇中国科学院
  • 9篇北京理工大学
  • 3篇江西理工大学
  • 1篇内蒙古师范大...
  • 1篇上海海洋大学
  • 1篇国家互联网应...
  • 1篇中国联通

作者

  • 11篇颜永红
  • 4篇王晶
  • 3篇吴超
  • 3篇付强
  • 3篇李军锋
  • 3篇许春冬
  • 2篇张晴晴
  • 2篇夏日升
  • 2篇潘接林
  • 2篇应冬文
  • 2篇谢湘
  • 1篇陈梦喆
  • 1篇王宪亮
  • 1篇葛凤培
  • 1篇李艳玲
  • 1篇张鹏远
  • 1篇匡镜明
  • 1篇杨立东
  • 1篇周若华
  • 1篇国雁萌

传媒

  • 4篇网络新媒体技...
  • 3篇Chines...
  • 2篇声学学报
  • 2篇电声技术
  • 1篇电讯技术
  • 1篇电子与信息学...
  • 1篇清华大学学报...
  • 1篇计算机应用
  • 1篇北京理工大学...
  • 1篇Journa...
  • 1篇中国科学:信...

年份

  • 1篇2017
  • 1篇2016
  • 3篇2015
  • 8篇2014
  • 7篇2013
  • 2篇2012
24 条 记 录,以下是 1-10
排序方式:
嵌入式中文语音合成系统非周期成分音节层建模方法
2013年
当前主流参数化语音合成系统大多采用混合激励的源-滤波器模型,而非周期成分是影响合成音音质的重要参数。该文探讨了如何更有效地对非周期成分建模以及在嵌入式语音合成系统中非周期成分的模型规模如何尽可能压缩。该文通过分析得到非周期成分在中文音节中前后帧存在较强相关性,因此在一个音节内一段固定频段上,可以对非周期成分形成的一条连续轨迹通过离散余弦变换(dis-crete cosine transformation,DCT)来拟合。实验证明,该方法在保持合成音音质与基线系统相当的情况下,可以将分带非周期成分(band aperiodicity,BAP)模型的大小压缩到原来的6.64%。
王朝民谢湘匡镜明
关键词:语音合成
Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers被引量:1
2013年
This study investigated whether adults who stutter and normal adult speakers differ in the production of stop consonants in fluent reading Chinese Putonghua speech.Voice onset time(VOT) was measured and the spectral moments at the stop burst were calculated for the stutterers(both before and after the speech therapy) and also for the nonstutterers. The statistical results showed that there were no significant differences in VOT between the nonstutterers and stutterers either prior to or after therapy,although the mean VOT of the stutterers was slightly greater than that of the nonstutterers.The results also indicated that both the obstruction place and the subsequent syllabic final exhibited an influence to a greater extent on VOT for the stutterers.In the spectral domain,the spectral mean of the stuttering participants before therapy was significantly different from that of the normal participants, whereas the group difference became insignificant after the therapy session.The smaller spectral mean for the stutterers might be interpreted as a more posterior occlusion in the oral cavity when producing alveolars and velars.In addition,productions of the stutterers scattered with a wider range in the space of spectral moments.Furthermore,the smaller main effect of syllabic finals on the mean spectral frequency of the burst suggested that the stutterers exhibited weaker anticipatory coarticulation than the nonstutterers.
FENG YongqiangYAN QianGAO XinglongPAN FupingXING LiliLIN ChunlanPAN Jielin
A forced alignment approach to detect Chinese repetitive stuttering
2013年
A forced alignment based algorithms to detect Chinese repetitive stuttering is studied. According to the features of repetitions in Chinese stuttered speech,improvement solutions are provided based on the previous research findings.First,a multi-span looping forced alignment decoding networks is designed to detect multi-syllable repetitions in Chinese stuttered speech.Second,branch penalty factor is added in the networks to adjust decoding trend using recursive search in order to reduce the error from the complexity of the decoding networks. Finally,we re-judge the detected stutters by calculating confidence to improve the reliability of the detection result.The experimental results show that compared to previous algorithm,the proposed algorithm can improve system performance significantly,about 18%average detection error rate relatively.
ZHANG JunboYAN QianGAO XinglongPAN FupingFENG YongqiangXING LiliLIN ChunlanPAN Jielin
卷积神经网络在语音识别中的应用被引量:15
2014年
研究了使用卷积神经网络构造模式分类器,并用于连续语音识别的研究。CNNs相比于广泛使用于语音识别中的深层神经网络(Deep Neural Network,DNNs),能在保证性能的同时,大大压缩模型的尺寸。在标准语音识别库TIMIT上的实验结果证明,相比传统DNN模型,CNN模型的识别性能更好,同时其模型规模和计算量都有明显降低。
张晴晴刘勇王智超潘接林颜永红
关键词:卷积神经网络连续语音识别
基于非负矩阵分解的钢琴多音符估计被引量:1
2014年
提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法。首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵。之后对测试的多音片段,采用同样处理方法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定求得多音符估计结果。性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅度的提升。
万玉龙王宪亮周若华颜永红
关键词:钢琴音乐非负矩阵分解
ANC次级通道在线建模的辅助噪声控制方法被引量:4
2014年
主动噪声控制(ANC)系统中利用辅助噪声作为激励信号对次级通道建模的方式,对系统达到稳态的残余噪声有较大的影响。本文提出了一种适用于次级通道在线建模的辅助噪声控制方法。引入两个自适应门限来控制辅助噪声的注入和停止:当次级通道的建模精度足够时,停止注入辅助噪声对次级通道建模,以减小稳态噪声残余;当次级通道发生变化时,重新注入辅助噪声,以跟踪次级通道的变化。仿真结果表明了提出算法的有效性。
杨茜吴超付强颜永红
关键词:主动噪声控制
多特征融合的英语口语考试自动评分系统的研究被引量:10
2012年
该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。
李艳玲颜永红
关键词:自动语音识别自动评分句法树
Speex编码器中回声消除算法的分析与评估被引量:5
2013年
随着VoIP技术在近年来的快速发展,互联网语音通信得到了越来越多的应用,IP电话的语音通信质量成为制约其发展的重要因素,VoIP系统中远端信号会返回传递给说话人端从而引起回声,严重影响通话质量。所研究的Speex编码器中的频域MDF回声消除算法是通过估计最佳的LMS算法自适应变步长,同时结合NLMS滤波器消除远端信号的回声,达到提高语音通话舒适度的目的,给出了Speex中回声消除算法的原理和参数分析,并进行实际系统测试和性能评估。
杨果王亚洁王晶
关键词:回声消除自适应步长自适应滤波
一种结合G.719编解码器的参数立体声音频编解码扩展方法
2014年
针对ITU-T G.719全频带音频编码标准尚不支持立体声压缩编码的问题,结合G.719编解码器提出并设计基于离散傅里叶变换(discrete Fourier transform,DFT)的参数立体声音频编解码扩展模块.输入音频信号进行DFT变换后在子带内提取相应的空间参数,并将左右声道下混为和声道;解码时,对和声道进行能量补充,分别运用等式法和基于Givens旋转的奇异值分解法(singular value decomposition,SVD)进行解码恢复.测试结果表明,在G.719中合理设计参数立体声编解码可以获得较好的压缩效果,对于平缓的音乐,等式法比奇异值分解法可解码得到稍高的音质,且复杂度较低;对于变化较快的音乐,奇异值分解法可得到相对较好的音质,但复杂度较高.
王晶赵毅纪璇
两扬声器配置下的串声消除系统参数优化设置被引量:1
2014年
针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
许春冬李军锋裘嫄夏日升颜永红
关键词:三维声音逆滤波
共3页<123>
聚类工具0