陈景东
- 作品数:14 被引量:19H指数:2
- 供职机构:华中科技大学更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于Mellin变换的语音新特征与说话人自适应技术的比较
- 为了减小由于说话人之间声道形状的差异而引起的非特定人语音识别系统性能的下降, 本文研究了两种方法,一种是基于最大似然估计的频率归正说话人自适应方法,另一种是基于Mellin变换的语音新特征。在非特定人孤立词语音识别系统上...
- 陈景东徐波黄泰翼
- 文献传递
- 连续语音识别的声学模型和搜索策略的研究
- 徐波黄泰翼高升李成荣张红陈景东贾磊慎熙鹏贾川赵兵
- 该研究在声学建模方面,对语音的段长信息和帧间相关信息进行了深入的研究,解决了利用聚类和决策树方法进行上下文相关的建模方法,提出了中心距离连续概率声学模型以及评价声学模型的困惑度指标;选用了决策树的方法进行汉语声调的上下文...
- 关键词:
- 关键词:语音识别声学模型搜索策略
- 几种高鲁棒性通道及说话人自适应语音识别算法研究被引量:12
- 1998年
- 鲁棒性问题是决定语音识别技术能否在实际中得以应用和推广的关键问题之一。概括起来说,导致语音识别系统性能变坏的原因大体上来自三个方面,即噪声(加性噪声、卷积噪声)、信道变化和不同的讲话者(不同的声道形状、不同的发育方式等)。本文对三种高鲁律性自适应语音识别方法进行了研究和改进,并对它们的性能进行了比较,这三种方法分别是VQ码本自适应法、HMM参数自适应法和基于正则相关分析的谱变换补偿方法。实验结果表明,这三种方法都能提高非特定人语音识别系统对信道以及说话人的鲁棒性,而且基于正则相关分析的稻变换补偿方法具有最好的性能,它能够补偿由三种失真源同时引起的训练条件与测试条件之间的不匹配,因此适合作为一种通用的自适应方法。
- 陈景东姚磊黄泰翼
- 关键词:鲁棒性说话人自适应算法语音识别算法
- 普通话及粤语版多领域听写系统产品开发及相关技术
- 徐波黄泰翼高升李成荣张红陈景东贾磊慎熙鹏贾川赵兵
- 非特定人、大词汇量、连续语音识别(LVCSR),具有非常大的研究价值。有了LVCSR技术,才能通过对某些模块的局部修改或通过采集专用应用环境下的语音数据来建立特定的应用系统;也只有有了LVCSR技术,才能拥有进行高水平研...
- 关键词:
- 关键词:语音识别
- 一种基于迟滞编码的自动语音端点检测方法被引量:6
- 1996年
- 端点检测在语音识别中占有十分重要的地位,端点检测的准确性将直接影响整个语音识别系统的性能。已往的自动端点检测方绝大多数都是利用帧平均能量EN,帧平均跨零数ZN,帧平均跨零积A和帧平均零比B等参数来确定语音段的始点和终点。这些方法的缺点是难以设置对各次实验都合适的固定阈值,这给实际应用带来了很多不便。本文提出了一种基于迟滞编码的自动端点检测方法──在对语音信号进行迟滞编码的基础上,利用各帧的码字和来判断语音段的起点和终点。该方法充分利用了噪声和信号的统计特性,克服了已往端点检测方法的不足。实验结果表明,该方法具有良好的性能。
- 陈景东徐波黄泰翼
- 关键词:语音端点检测语音信号语音识别系统统计特性码字
- 一种实时公交车客流量统计的方法
- 本发明提供了一种实时公交车客流量统计的方法,该方法采用了机器学习,多目标检测与跟踪以及目标行为分析等方法,属于模式识别技术领域。具体为:通过分析视频图像中乘客人头的形状、纹理信息实现乘客目标的检测(采用梯度方向直方图表征...
- 桑农黄朝露陈景东刘乐元罗大鹏唐奇玲高常鑫王海王强李驰
- 一种实时公交车客流量统计方法
- 本发明提供了一种基于目标先验分布的实时公交车客流量统计的方法,采用了目标检测、目标跟踪、目标行为分析等方法,属于模式识别技术领域。具体为:利用目标先验灰度统计直方图对输入视频图像进行反向投影运算,再对反向投影图像进行差分...
- 桑农陈景东黄朝露刘乐元罗大鹏唐奇玲高常鑫王海王强李驰
- 文献传递
- 智能视频监控中的目标检测技术研究
- 图像以及视频中的目标检测一直是计算机视觉研究领域的重点,也是智能视频监控系统中关键技术。本文的目标是通过对常见视频监控环境下的目标检测算法的研究,获得特定环境下实时、准确的目标检测算法,为智能视频监控系统的上层应用提供重...
- 陈景东
- 关键词:智能视频监控离线学习目标检测级联分类器支持向量机
- 文献传递
- 基于Mellin变换的语音新特征与频率归正说话人自适应技术
- 2000年
- 为了减小由于说话人之间声道形状的差异而引起的非特定人语音识别系统性能的下降 ,研究了两种方法 ,一种是基于最大似然估计的频率归正说话人自适应方法 ,另一种是基于 Mellin变换的语音新特征 .在非特定人孤立词语音识别系统上的初步实验表明 ,这两种方法都可以提高系统对不同说话人的鲁棒性 ,相比之下 ,基于 Mellin变换的语音新特征具有更好的性能 ,它不仅提高了系统对不同话者的识别性能 ,而且也使系统对不同话者的误识率的离散程度大大减小 .
- 陈景东徐波黄泰翼
- 关键词:自适应语音识别
- 一种监督学习机用户学习活动的方法
- 本发明提出了一种利用学习机用的人脸姿态辅助估计其视线的方法,并借此方法实现了让学习机自动监督用户的某些学习活动的目的。具体为:要求学习机用户在进行需要别人监督但身边又无人监督的学习活动时,用户双眼必须正视学习机,学习机系...
- 桑农刘乐元黄朝露高常鑫黄玄姑陈景东王海
- 文献传递