国家自然科学基金(60663006)
- 作品数:18 被引量:71H指数:5
- 相关作者:吐尔根·依布拉音艾山吾买尔禹龙田生伟艾山·吾买尔更多>>
- 相关机构:新疆大学伊犁师范学院中国科学院更多>>
- 发文基金:国家自然科学基金新疆大学校院联合资助国家电子信息产业发展基金更多>>
- 相关领域:自动化与计算机技术自然科学总论语言文字更多>>
- 汉文-维吾尔文双语语料库中段落对齐技术研究被引量:6
- 2010年
- 随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.
- 热西旦.塔依吐尔根.依布拉音
- 维吾尔语形容词构形词缀有限状态自动机被引量:4
- 2009年
- 维吾尔语单词的构形词缀按照一定的规则连接到词干。维吾尔语的黏着言特点和构形词缀连接规则使得可以构造维吾尔语构形词缀的有限状态自动机。该文将详细介绍维吾尔语形容词构形词缀有限自动机的构造步骤。
- 早克热·卡德尔吐尔根·依布拉音
- 关键词:维吾尔语有限自动机语音和谐词干提取
- Chinese-Uighur Sentence Alignment Based on Hybrid Strategy with Mistake Spread Suppression
- This paper proposes a Hybrid algorithm based on mistake spread suppression to align Chinese-Uighur Sentences. ...
- Turgun.Ibrahim
- 维吾尔文音节切分方法的研究与实现
- 本文分析维吾尔语的言语形式,研究维吾尔文音节的构成规则,给出了音节分解思路,设计并实现了维吾尔文音节自动切分算法及程序,在对大量生语料进行统计测试的基础上,一共收集了2954个音节,构成了常用音节库。维吾尔语音节切分算法...
- 阿比达.吾买尔吐尔根.依布拉音
- 关键词:维吾尔语
- 文献传递
- 一种提高维吾尔语-汉语词语对齐的方法研究被引量:9
- 2012年
- 维吾尔语是典型的粘着性语言,其复杂的形态以及众多的词缀影响维吾尔语-汉语词语对齐的质量.本文提出对维吾尔语词进行形态分析并词干与词缀分离,再进行对齐;并根据维吾尔语遵循语音和谐规律的特点,对维吾尔语词缀的变体采用统一的表示方法,使得词缀呈现相同的形式.通过以上方法欲达到抑制维汉词语对齐中数据稀疏现象.本文利用此方法处理了新疆多语种信息技术重点实验室提供的维汉双语语料,再利用GIZA++进行对齐,试验结果表明,此方法对词语对齐效果起到了明显的积极作用,而且对维汉机器翻译的质量也有显著的提高.
- 麦热哈巴·艾力王志洋吐尔根·依布拉音
- 关键词:词对齐维吾尔语形态分析
- 汉文-维吾尔文双语对齐语料库的实验性研究
- 本文阐述了汉文-维吾尔文双语对齐语料库的构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法。本文所实验的语料库收集汉文-维吾尔文双语句子对齐语1000句左右,可进行汉文和维吾尔文关键词检索,查询语料库中...
- 热西旦·塔依加米拉·吾守尔吐尔根·依布拉音
- 关键词:双语语料库句子对齐机器翻译系统
- 文献传递
- 汉文-维吾尔文双语语料库中基于词典译文的句子对齐方法研究被引量:4
- 2009年
- 双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻译较完整的词典作为桥梁,将汉维句子关联起来.根据维吾尔语文本中的单词,在词典中找到其对应的译文,并将译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.
- 热西旦.塔依吐尔根.依布拉音
- 关键词:汉文维吾尔文机器翻译句子对齐双语语料库
- 汉文-维吾尔文句子对齐模型的XML标记规范被引量:1
- 2007年
- 近些年来,在语言信息处理研发、双语教学和对比研究以及双语词典编纂研究中,双语语料库的作用日益凸显出来.在双语语料库中,不仅要描述双语文本在句子一级的对齐信息,还要详细描述收入语料库中的双语文本的所有者、领域、时间等方面的属性信息.为便于数据交换和共享,所有语料文本均采用XML编码方式来描述信息.详细阐述了构建的汉文-维吾尔文平行语料库的对齐句子和一些属性信息的XML标记规范和XML标记算法的设计方法.
- 热西旦木.塔依吐尔根.依布拉音
- 关键词:双语语料库句子对齐
- 维吾尔语单句句法分析研究
- 本文主要讨论了维吾尔语生成句法研究及其句法规则,基于规则的维吾尔语句法分析方法与基于LR算法的维吾尔语句法分析方法。
- 阿力甫·库尔班阿力木江·托乎提吐尔根·依布拉音
- 关键词:句法分析上下文无关文法维吾尔语
- 文献传递
- 基于规则的维吾尔语对偶词识别算法研究被引量:3
- 2009年
- 维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概念和特征,然后分析了维吾尔语对偶词的结构特征和结合规则.在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法,并通过试验证明了该算法的正确性.
- 扎依达.木沙吐尔根.依布拉音
- 关键词:维吾尔语对偶词