那顺乌日图
- 作品数:54 被引量:137H指数:8
- 供职机构:内蒙古大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字理学政治法律更多>>
- 《蒙古语语法信息词典量词分库》的建设
- 《蒙古语语法信息词典》是为实现蒙古语语句的自动分析与自动生成而研制的、囊括词法形态、句法功能、搭配特征以及正字法规则等信息的一部机器词典。它由蒙古语语法信息词典总库》(以下简称《总库》)和各个分库等不同层次构成,《蒙古语...
- 海银花那顺乌日图
- 关键词:语法信息机器词典
- 文献传递
- 基于统计语言模型的蒙古文词切分被引量:16
- 2009年
- 通过对蒙古文词切分技术的分析,利用规则作为切分的基础,提出一种统计和规则相结合的蒙古文词切分方法.这种方法利用蒙古语统计语言模型作为排歧依据,使用的语言模型有基于词性的语言模型和Skip-N语言模型.其词切分准确率比基于规则的系统有较大提高.
- 侯宏旭刘群那顺乌日图牧仁高娃李锦涛
- 关键词:蒙古语语言模型
- 蒙古文国际标准编码诸规则被引量:12
- 1998年
- 蒙古文国际标准编码的制定工作是一项系统工程,它一方面关系到ISO/IEC10646这样的国际标准所必须遵循的各种规定,另一方面也要体现蒙古文等五种文字的各种特点与规律,制定适合这些文字规律特点的各种规则。本文从理论与实践两个方面探讨了蒙古文国际标准编码的显现规则、“控制符”使用规则和几个标点符号的使用规则。
- 那顺乌日图确精扎布
- 关键词:蒙古文
- 《蒙古语语法信息词典量词分库》的建设
- 《蒙古语语法信息词典》是为实现蒙古语语句的自动分析与自动生成而研制的、囊括词法形态、句法功能、搭配特征以及正字法规则等信息的一部机器词典。它由《蒙古语语法信息词典总库》(以下简称《总库》)和各个分库等不同层次构成,《蒙古...
- 海银花那顺乌日图
- 文献传递
- 蒙古语词法分析的有向图模型被引量:3
- 2011年
- 我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词缀及其相应标注,而边则表示节点之间的转移或生成关系。特别地,在本工作中我们刻画了词干到词干转移概率、词缀到词缀转移概率、词干到词缀生成概率、相应的标注之间的三种转移或生成概率,以及词干或词缀到相应标注相互生成概率。以内蒙古大学开发的20万词规模的三级标注人工语料库为训练数据,该模型取得了词级切分正确率95.1%,词级联合切分与标注正确率93%的成绩。
- 姜文斌吴金星长青那顺乌日图刘群赵理莉
- 关键词:词法分析词语切分词性标注词干提取有向图
- 蒙古文词根、词干、词尾的自动切分系统被引量:20
- 1997年
- 在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上考察和比较了蒙古语的词根、词干和构形词尾,在传统语法的研究成果和计算语言学方法相结合的基础上把蒙古文近200种词尾分成三大类,并根据各类词尾的不同特点编制了几种词典,设计,提出了二十多组语法条件和若干个生成规则,在计算机上实现了自动切分。据测试,使用该系统可以覆,盖现代蒙古语各类文本的95%以上。
- 那顺乌日图
- 关键词:蒙古文词根词干词尾
- 蒙古文人名自动识别研究
- 人名自动识别是语料库深加工及机器翻译等蒙古文信息处理工作中的重要环节之一。我们针对蒙古文人名词语的不同构成特点采取直接标注、词典匹配以及基于上下文的算法等方式进行自动识别。经过初步测试,该算法的识别召回率可达89%,准确...
- 那顺乌日图雪艳淑琴敖日格乐
- 关键词:蒙古文人名自动识别语料库加工
- 文献传递
- 《达日罕汉蒙电子词典管理工具》的设计与建造
- 《达日罕汉蒙电子词典》面世以来,深受广大群众的欢迎,但同时我们发现它存在着一些漏洞,所以有必要进行语言层面的扩充、完善和技术层面的改进、调试。针对语言层面的扩充和完善,本文设计了《达日罕汉蒙电子词典数据库管理工具》,并对...
- 乌日力嘎乌仁曹都那顺乌日图
- 关键词:电子词典数据库管理管理工具
- 文献传递
- 关于面向信息处理的蒙古语语义研究被引量:7
- 2002年
- 蒙古文信息处理 ,无论是基础研究 ,还是应用开发 ,都离不开对词汇进行语法属性和语义属性的描述 ,描述体系将全面地反映现代蒙古语常用词语的语义特征 ,为蒙古文的各种应用系统提供较全面、翔实的语义知识。并且这些语义知识应该以易于算法化、形式化和机器处理的方式来提供。
- 那顺乌日图
- 关键词:语义研究语义属性形式化
- '蒙古语语法信息词典'框架设计
- 蒙古文信息处理工作,无论是自动切分、自动生成或自动标注,还是机器翻译,都需要一部机器词典.研制一部面向各种处理系统的,通用的蒙古语语法信息词典是蒙文信息处理工作的当务之急.研制该词典首先运用计算语言学理论与方法,分析和归...
- 那顺乌日图
- 关键词:蒙古语语法信息机器翻译机器词典信息处理
- 文献传递