刘志文
- 作品数:6 被引量:16H指数:2
- 供职机构:内蒙古大学计算机学院更多>>
- 发文基金:内蒙古自治区自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于trigger对的长距离蒙古语语言模型的改进Katz平滑技术被引量:1
- 2010年
- 数据平滑技术主要是用来解决统计语言模型在实际应用中数据稀疏问题,它是语言建模的核心技术,Katz平滑方法是应用最广泛的方法之一.本文对Katz平滑算法作了改进,使之应用于trigger对的平滑,并在汉语-蒙古语机器翻译系统实现了该算法,实验结果表明该技术可以提高翻译效果.
- 刘志文侯宏旭宋美娜李沙茹拉
- 关键词:蒙古语语言模型
- 基于trigger对的蒙古语语言模型的三种实现方法的比较
- 基于trigger对的长距离蒙古语语言模型采用统计方法进行自然语言建模。本文简要介绍了基于trigger对的长距离蒙古语语言模型的三种实现方法,并在汉语一蒙古语机器翻译系统测试了这三种方法的性能。本文旨在通过对三种模型的...
- 侯宏旭刘志文
- 关键词:蒙古语语言模型自然语言处理机器翻译系统
- 文献传递
- 基于trigger对的蒙古语语言模型的三种实现方法比较被引量:2
- 2009年
- 基于trigger对的长距离蒙古语语言模型采用统计方法进行自然语言建模。该文简要介绍了基于trigger对的长距离蒙古语语言模型的三种实现方法,并在汉语-蒙古语机器翻译系统测试了这三种方法的性能。该文旨在通过对三种模型的比较研究,为基于trigger对的长距离蒙古语语言模型的具体应用提供参考和依据。
- 刘志文侯宏旭李沙茹拉柳林
- 关键词:人工智能自然语言处理蒙古语语言模型
- 基于trigger对的长距离蒙古语语言模型的研究
- 语言模型(Language Model)是描述自然语言内在规律的数学模型,在机器翻译、语音识别、文字处理、信息检索等领域中占据着十分重要的地位。-个可靠的语言模型对于提高机器翻译系统的识别率起重要的作用。
蒙古...
- 刘志文
- 关键词:蒙古语语言模型机器翻译信息处理系统
- 文献传递
- Skip-N蒙古文统计语言模型被引量:11
- 2008年
- 蒙古文具有典型的构词词缀的特点,一个词往往可以切分成词干和词缀等若干个部分.如果采用通常的N-gram语言模型很难描述词干、词缀等的长距离依赖关系.提出了一种利用长距离依赖的Skip-N语言模型,给出了相隔N个词的二元依赖关系.对这种方法进行了实现,并在一个基于实例的汉蒙机器翻译系统上进行了实验,实验证明Skip-N语言模型能够有效地提高汉蒙机器翻译的效果.
- 侯宏旭刘群刘志文张国强
- 关键词:机器翻译蒙古语语言模型
- 层次化蒙古语统计语言模型被引量:2
- 2009年
- 蒙古文具有典型的构词、构形词缀的特点,一个蒙古语单词往往可以切分成词干和词缀等若干个部分.根据蒙古语的特点,提出了一种层次化的蒙古语语言模型,将蒙古语语言模型分为词干和词干、词干和词缀、词缀和词缀三个层次.在这三个层次上分别计算出独立的语言模型.把这种层次化的蒙古语语言模型方案应用到了一个统计汉蒙机器翻译系统中,实验证明所构造的层次化的蒙古语语言模型能够有效地提高汉蒙机器翻译的效果.
- 侯宏旭张国强刘志文
- 关键词:蒙古语语言模型机器翻译词干词缀