倪崇嘉 作品数:20 被引量:102 H指数:5 供职机构: 山东财经大学 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
汉语韵律短语的时长与音高研究 被引量:15 2009年 语句和篇章的韵律结构和信息结构的分析及模型化是提高语音合成的自然度、降低自然语言识别错误率的关键。该文在带有韵律标注ASCCD语料库的基础上对韵律短语的时长和音高特性进行了研究,得到并验证了如下一些结论:(1)韵律短语边界对音节时长有明显的延长作用,不同声调对音节的时长延长作用不同,并且不同的重音级别对音节时长的延长作用也不同。(2)韵律短语边界处中断的时长在较小的韵律边界表现的更为明显。韵律短语的边界处发生了明显的音高重置现象,韵律短语的音高低线总是下降的,而音高高线只是在重音后下降,并且重音处的音域大而且音高高线的位置高。 倪崇嘉 刘文举 徐波关键词:计算机应用 中文信息处理 时长 音高 基于直方图势函数做标记和纹理特征合并的分水岭算法 2005年 本文研究了一种基于形态学处理和纹理特征合并的水域算法,该方法首先对形态梯度图进行滤波处理,以获得较好的参考图像,然后又利用图像的直方图势函数对图像做标记。最后,为了获得整体的目标,我们对上面所得到的分割结果进行了区域一致性、纹理一致性和对比度的检验,来合并用水域算法获得的分割结果,以获得更好的分割效果,并通过试验验证了算法的有效性。 倪崇嘉 张爱英 刘文奇关键词:数学形态学 基于数学形态学的视频图像序列中的运动目标检测 被引量:11 2006年 R.Keshet(Kresch)提出了完备半格中的数学形态学,并给出了在视频图像序列中运动对象检测的应用。本文利用运动补偿、形态学方法和模板填充提出了复杂背景下的运动目标检测算法,并验证了算法的有效性和正确性。 倪崇嘉 刘文奇 张爱英关键词:数学形态学 运动目标检测 基于互补模型的汉语重音检测 被引量:3 2011年 针对现有汉语重音检测方法正确率较低的问题,利用声学、词典和语法相关特征的不同分类器组合,基于Boosting分类回归树+条件随机场的互补模型,提出一种改进的汉语重音检测方法。在ASCCD语料库上的实验结果表明,该方法能获得84.9%的重音检测正确率,相比基于神经网络+决策树的基线系统提高2.7%。 倪崇嘉 刘文举 徐波关键词:重音 条件随机场 神经网络 支持向量机 汉语和英语音高重音自动标注方法的对比与分析 2012年 虽然汉语和英语的重音自动标注被广泛的研究,但是关于汉语和英语的重音自动标注之间对比的研究还鲜有报道。基于汉语韵律标注库ASCCD和英语韵律标注库Boston University Radio News Corpus,对汉语和英语的重音自动标注的异同进行对比,考察不同的特征在不同语言的语料库上的泛化性能。通过基于集成分类回归树的重音自动标注实验、特征分析及基于互信息的重音自动标注的声学对比,得到如下结论:在相同的条件下,汉语重音自动标注的正确率比英语重音自动标注的正确率要低;在重音自动标注中,词典语法相关特征比声学相关的特征更重要;不同的声学信息源在重音自动标注中所起的作用不同,时长相关的特征对汉语和英语重音自动标注都很重要;英语中大部分特征提供的互信息要比汉语相应的特征提供的互信息要高。 倪崇嘉 刘文举 徐波关键词:自动标注方法 重音 汉语 音高 BOSTON 分类回归树 汉语韵律短语的时长与音高研究 语句及篇章的韵律结构和信息结构的分析和模型化是提高语音合成的自然度、降低自然语言识别错误率的关键。本文在带有韵律标注ASCCD语料库的基础上对韵律短语的时长和音高特性进行了研究,得到并验证了如下一些结论:(1)韵律短语边... 倪崇嘉 刘文举关键词:韵律短语 时长 音高 语言识别 文献传递 基于声学相关特征与词典语法相关特征的汉语重音检测 被引量:8 2011年 重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting集成分类回归树对当前音节的声学相关特征以及词典语法相关特征进行建模,Boosting集成分类回归树充分利用了当前音节的特性.同时还对词典语法相关特征采用条件随机场方法建模,条件随机场很好地利用了当前音节的上下文特性.最后,将Boosting集成分类回归树模型和条件随机场模型加权组合获得识别率更高的混合模型.该混合模型克服了Boosting集成分类回归树模型的不足,实现了Boosting集成分类回归树和条件随机场的优势互补.实验结果表明该方法具有较好的分类效果,在ASCCD语料库上能够获得84.82%重音检测正确率.同时,与之前其他人的工作在相同的条件下(相同的训练集和测试集)对比,在正确率方面,该方法分别有4.01%和1.67%的提高.另外,该文中,对英语的重音检测和汉语的重音检测做了对比,并通过特征分析方法从另一个层面验证了一些语言学上的结论. 倪崇嘉 张爱英 刘文举关键词:重音 条件随机场 神经网络 分类回归树 基于韵律间断层级的汉语韵律间断分类 被引量:1 2011年 针对韵律间断的层次性,提出了一种层次韵律间断分类方法。该方法能够充分利用韵律结构层次性,同时又能够充分利用来自声学、词典以及语法方面的特征,对不同类型的韵律间断进行分类。通过在具有韵律标注库ASCCD上的实验,该算法在综合测试集上达到平均78.25%检测正确率。 倪崇嘉 张爱英 刘文举 徐波关键词:层级结构 汉语大词汇量连续语音识别系统研究进展 被引量:46 2009年 大词汇量连续语音识别(LVCSR)技术近年来发展迅速,并在许多领域得到了广泛的应用,国内外许多大公司加大了对语音识别技术的研究,不少商业化的语音识别系统已经面世,并得到较为广泛的使用。该文综述了近年来大词汇量连续语音识别技术的研究进展,描述了汉语大词汇量连续语音识别系统,主要是基于统计方法的语音识别系统的框架与设计方法,对语音识别系统的一些关键技术和原理进行了分析,并对近年来国内外对语音识别研究发展动向进行了讨论。 倪崇嘉 刘文举 徐波关键词:中文信息处理 语音识别 模型自适应 搜索技术 基于互补模型的汉语韵律间断自动检测 2011年 自动韵律间断检测和标注对语音理解和语音合成有十分重要的作用。提出了利用声学、词典和语法相关特征的互补模型方法检测汉语韵律间断。该方法具有下列优点:(1)摒弃了声学相关特征和词典、语法相关特征的独立性假设;(2)互补模型方法不仅在特征层上利用当前音节的上下文信息,而且在模型层次上利用了当前音节的上下文信息。在ASCCD语料库上验证了该方法能够获得90.34%的韵律间断的检测准确率,较基线系统有6.09%的提高。 倪崇嘉 刘文举 徐波关键词:条件随机场 神经网络 支持向量机