李明琴
- 作品数:5 被引量:28H指数:3
- 供职机构:清华大学信息科学技术学院电子工程系更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 语音识别音字转换中的快速容错算法被引量:6
- 2002年
- 本文研究了汉语连续语音识别音字转换中的容错算法,以纠正声学识别的替代、插入、删除错误。为了解决容错算法的计算量问题,本文提出了两种快速算法。一是针对单独出现错误的快速容错算法;二是针对关键词的快速容错算法。快速算法有效地限制了容错算法的搜索空间,提高了计算效率。快速容错算法应用在电话对话系统中,字正确率从78.97%提高到86.68%,关键词检测正确率从80.56%提高到88.52%,并且算法运算时间满足实时性要求。
- 李明琴王作英陆大■
- 关键词:语音识别音字转换稳健语音识别口语对话系统关键词检测搜索空间
- 电话语音库的设计与实现
- 语音数据库是语音识别技术研究的基础.当语音技术的研究进入实用化阶段时,对语音库的建设也提出了更高的要求,因此,建立大规模、高质量的电话语音数据库是这一领域的关键性问题.本数据库是国家863支持的项目,采用自动方式收集长达...
- 王侠李明琴肖熙王作英
- 关键词:电话语音识别语音数据库
- 文献传递
- 语义分析和结构化语言模型被引量:12
- 2005年
- 提出了一个语义分析集成系统,并在此基础上构建了结构化的语言模型.该语义分析集成系统能够自动分析句子中各个词的词义以及词之间的语义依存关系,达到90.85%的词义标注正确率和75.84%的语义依存结构标注正确率.为了描述语言的结构信息和长距离依存关系,研究并分析了两种基于语义结构的语言模型.最后,在中文语音识别任务上测试两类语言模型的性能.与三元语言模型相比,性能最好的语义结构语言模型——中心词三元模型,使绝对字错误率下降0.8%,相对错误率下降8%.
- 李明琴李涓子王作英陆大
- 关键词:语义分析依存分析语言模型语音识别
- 电话语音库的设计与实现
- 语音数据库是语音识别技术研究的基础。当语音技术的研究进入实用化阶段时,对语音库的建设也提出了更高的要求,因此,建立大规模、高质量的电话语音数据库是这一领域的关键性课题。本数据库是国家863支持的项目,采用自动方式收集长达...
- 王侠李明琴肖熙王作英
- 文献传递
- 中文语义依存关系分析的统计模型(英文)被引量:11
- 2004年
- 该文提出了一个统计语义分析器 ,它能够发现中文句子中的语义依存关系 .这些语义依存关系可以用于表示句子的意义和结构 .语义分析器在 1百万词的标有语义依存关系的语料库 (语义依存网络语料库 ,SDN)上训练并测试 ,文中设计、实现了多个实验以分析语义分析器的性能 .实验结果表明 ,分析器在非限定领域中表现出了较好的性能 ,分析正确率与中文句法分析器基本相当 .
- 李明琴李涓子王作英陆大
- 关键词:语义分析依存语法