您的位置: 专家智库 > >

陈国平

作品数:10 被引量:10H指数:2
供职机构:中国科学院声学研究所更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 4篇期刊文章
  • 3篇会议论文
  • 2篇专利
  • 1篇学位论文

领域

  • 5篇电子电信
  • 5篇自动化与计算...

主题

  • 7篇语音
  • 4篇语音识别
  • 3篇语音合成
  • 2篇帧间
  • 2篇帧率
  • 2篇帧速
  • 2篇帧速率
  • 2篇速率
  • 2篇系统内存
  • 2篇系统资源
  • 2篇鲁棒
  • 2篇媒体流
  • 2篇内存
  • 1篇印刷
  • 1篇噪声
  • 1篇噪声鲁棒性
  • 1篇置信度
  • 1篇声学
  • 1篇声学建模
  • 1篇频带

机构

  • 10篇中国科学院
  • 3篇南京工业大学
  • 3篇中国科学院研...
  • 1篇中国石油化工...

作者

  • 10篇陈国平
  • 5篇张明新
  • 5篇付跃文
  • 3篇王劲林
  • 2篇单明辉
  • 2篇倪宏
  • 2篇张东滨
  • 2篇陈君
  • 1篇杜利民
  • 1篇刘浩杰

传媒

  • 2篇计算机工程与...
  • 2篇第八届全国人...
  • 1篇计算机应用
  • 1篇中国科学院研...
  • 1篇第八届全国人...

年份

  • 1篇2009
  • 1篇2008
  • 4篇2006
  • 4篇2005
10 条 记 录,以下是 1-10
排序方式:
高性能的多体印刷英文识别系统的实现被引量:3
2006年
提高低质量文本图像的识别率是现今文字识别研究的重要方向。文章对倾斜文本行的切分算法,断裂、粘连、交叠字符的切分算法以及后处理作了较为深入的研究,提出一些新的算法。该系统能够识别多达260种字体,包括黑体、斜体等字体,对训练集的识别率达到98.5%,并在实际应用中取得了良好效果。
陈国平张明新付跃文王劲林
关键词:光学字符识别字符切分后处理
基于混合激励的高质量语音合成声源模型
在基于LPC的语音合成系统中,采用混合激励声源模型可以提高合成语音的自然度,但传统混合激励模型的线性相位假设与实际语音不符,因而合成语音的自然度还不够理想。本文提出了一种新的脉冲形状滤波器系数提取算法,该算法利用浊音余量...
陈国平付跃文张明新张东滨王劲林
关键词:语音合成
文献传递
基于Word Lattice结构的语音识别置信度算法被引量:2
2006年
wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前后向算法高效计算lattice中每个弧的词后验概率及以其为基础计算每个词的置信度的算法。
付跃文陈国平刘浩杰
关键词:语音识别置信度WORDGRAPH
一种平滑IP媒体流突发帧率的方法
本发明公开了一种平滑IP媒体流突发帧率的方法,包括:从计算机的系统内存中取出一帧,准备发送;计算当前帧的预计发送时间与上一帧的实际发送时间的时间间隔,将发送时间间隔与用户设定的两帧间最小时间间隔进行比较,根据比较的结果判...
单明辉陈君陈国平
文献传递
基于混合激励的高质量语音合成声源模型
在基于LPC的语音合成系统中,采用混合激励声源模型可以提高合成语音的自然度,但传统混合激励模型的线性相位假设与实际语音不符,因而合成语音的自然度还不够理想。 本文提出了一种新的脉冲形状滤波器系数提取算法,该算法利用...
陈国平付跃文张明新张东滨王劲林
关键词:语音合成
文献传递
一种平滑IP媒体流突发帧率的方法
本发明公开了一种平滑IP媒体流突发帧率的方法,包括:从计算机的系统内存中取出一帧,准备发送;计算当前帧的预计发送时间与上一帧的实际发送时间的时间间隔,将发送时间间隔与用户设定的两帧间最小时间间隔进行比较,根据比较的结果判...
单明辉陈君陈国平
文献传递
一种用于并行模型噪声鲁棒语音识别的特征构造方法
在噪声鲁棒语音识别研究中,并行模型结合方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。本文提出了利用前后向差分动态特征取代传统的一阶、二阶差分动态参数的特征构造...
张明新倪宏陈国平张东滨
关键词:语音识别噪声鲁棒性
文献传递
基于PMC方法的鲁棒声学模型研究被引量:1
2006年
在噪声鲁棒语音识别研究中,使用并行模型结合(parallel model combination,PMC)方法得到的模型理论上能够接近匹配噪声环境模型的性能,故成为噪声鲁棒语音识别的重要研究方向.本文首先提出了一种基于前后向差分动态参数的特征MFCC—FWD—BWD,该特征满足PMC对特征构造矩阵可逆的要求.在此基础上,提出了一种用于PMC的新模型———并行子状态隐马尔可夫模型(parallel sub-state hidden Markov model,PSSHMM),该模型每个状态包含平行关系的子状态,且子状态间存在转移关系.实验表明,PSSHMM模型在各种噪声和SNR下取得了较好的识别效果,特别是对于非平稳噪声,其鲁棒性能非常显著.
张明新倪宏张东滨陈国平
关键词:语音识别
基于MBIC的决策树聚类算法在连续语音识别中的应用被引量:2
2005年
提出了一种采用最小贝叶斯信息准则(MinimumBayesianInformationCriterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(MaximumLikeihoodCriterion,MLC)相比,MBIC对声学模型参数和训练数据集的变化具有更好的适应能力。
陈国平杜利民付跃文王劲林
关键词:连续语音识别
基于HMM的语音合成中声学建模和模型训练的研究
“可以交谈的计算机”一直是语音技术、人工智能等相关领域科研工作者不懈追求的目标。HMM语音合成系统在可懂度方面已经达到了可以接受的程度,但在自然度方面离人们的期望还有一定的距离。声学建模是提高HMM语音合成系统自然度的主...
陈国平
关键词:声学建模语音合成宽频带
文献传递
共1页<1>
聚类工具0