包塔
- 作品数:11 被引量:18H指数:3
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于多种知识的汉语盲文翻译的研究
- 北京图书馆研制的盲人阅读机,是将印刷体普通汉字文本通过扫描输入计算机进行识别,再将识别的汉字转换成声音由计算机输出,使盲人能够阅读普通文本.本文的主要工作是实现汉语双拼盲文到汉字的转换.
- 江铭虎朱小燕夏莹张钹谭刚包塔
- 文献传递
- 汉语盲文到汉字的自动转换方法
- 本发明属于计算机文字处理技术领域,涉及汉语盲文到汉字的自动转换方法,将盲文书籍扫描后识别成为盲文文本,或用键盘输入盲文文本,将该盲文文本当作拼音流转换为汉字;所说的拼音与汉字转换的每一个环节,利用汉语盲文综合知识库,在带...
- 朱小燕江铭虎夏莹马少平姜哲包塔谭刚
- 文献传递
- 中文汉语到盲文的自动转换方法
- 本发明属于计算机文字处理技术领域,其特点是首先根据汉语盲文分词连写规则对汉字文本作盲文分词连写,然后将词转换成盲文;使用该方法,三字以上的词很少有多音现象。具有特殊符号输入转换。可在文档中输入、转换数学符号。同时可以根据...
- 朱小燕江铭虎夏莹马少平姜哲包塔谭刚
- 文献传递
- 基于多知识的统计语言模型的研究与应用
- 包塔
- 关键词:统计语言模型
- 基于多种知识的盲文翻译的研究被引量:7
- 2000年
- 盲文到汉字的转换研究 ,分为盲文到拼音和拼音到汉字的转换研究。论文通过引入音码表 ,很好地解决了盲文到拼音转换中的歧义问题。对于拼音到汉字的转换 ,采用Markov模型 ,使用平滑算法解决此模型中的数据稀疏问题 ,并且对通常使用的字级别二元模型的平滑算法进行了改进以适应词级别二元模型。为每一个拼音句子建立一个拼音到汉字转换多部图 ,并在此转换多部图中使用 Viterbi算法搜索一条具有最大似然度的汉语句子 ,或使用 N - Best算法搜索具有头 N大似然度的 N个汉语句子。同时研究了从 1选到 N选的转换判据 ,以进行自动的 N - Best转换。实验表明 ,盲文到汉字转换系统的转换正确率为 94.38% ,若剔除专有名词 ,转换正确率还可上升 2个百分点。对 N - Best搜索算法的测试表明 5选正确率比 1选正确率提高了
- 江铭虎朱小燕夏莹谭刚包塔
- 关键词:拼音汉字
- 盲人用计算机软件系统中的语音和自然语言处理技术被引量:10
- 2004年
- 本文介绍了智能技术与系统国家重点实验室开发的“北极光”盲人用计算机软件系统中涉及的语音和语言处理技术。该系统能够获取和分析需要反馈的屏幕信息 ,通过语音合成平台将其内容朗读出来 ,对用户进行语音提示 ;与汉语自动分词、语言模型等自然语言处理技术的结合 ,使系统能够进行汉字和盲文的转换 ,反馈信息可以通过盲文点显器输出 ,使用户能够摸读盲文点字来获取所需要的信息 ,用户也可以采用盲文输入法进行输入 。
- 庄丽包塔朱小燕
- 关键词:计算机应用中文信息处理语音合成文本分析汉语自动分词语言模型
- EasyBraille:中文汉语盲文自动转换系统(英文)
- 本文提出并实现了一个中文汉语盲文自动转换系统.该系统不仅能够将打印的盲文文档通过扫描仪输入成为图像文件,进一步进行自动识别转换.同时可以将中文汉字文档自动转换成为盲文文档便于盲人阅读.本系统包含两个关键技术:汉语自动分词...
- 朱小燕包塔
- 文献传递
- 盲人用计算机软件系统中的语音和自然语言处理技术
- 本文介绍了智能技术与系统国家重点实验室开发的“北极光”盲人用计算机软件系统中涉及的语音和语言处理技术。该系统能够获取和分析需要反馈的屏幕信息,通过语音合成平台将其内容朗读出来,对用户进行语音提示;与汉语自动分词、语言模型...
- 庄丽包塔朱小燕
- 关键词:语音合成文本分析汉语自动分词语言模型
- 文献传递
- 盲汉转换系统的研究与实现被引量:4
- 2004年
- 介绍了中文现行盲文和汉字相互转换中自然语言处理技术的研究与应用。在双拼盲文和汉字转换模型[1]研究的基础上,利用包含多知识的语言模型成功地实现了歧义程度更高的现行盲文和汉字的高精度转换。
- 包塔朱小燕
- 关键词:语言模型现行盲文
- 中文汉语到盲文的自动转换方法
- 本发明属于计算机文字处理技术领域,涉及中文汉语到盲文的自动转换方法,包括:首先对非汉语符号进行预切分处理,读入一段连续的汉字串,根据词汇表分别用MM法和RMM法进行分词;比较MM和RMM分词结果是否相同,相同,记录分词结...
- 朱小燕江铭虎夏莹马少平姜哲包塔谭刚
- 文献传递