吴小川
- 作品数:3 被引量:15H指数:2
- 供职机构:新疆大学信息科学与工程学院更多>>
- 发文基金:电子信息产业发展基金国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉维哈柯双语平行语料库加工处理系统的设计与实现被引量:4
- 2011年
- 汉维哈柯双语平行语料库是建设综合型语言知识库的有机组成部分,又是基于实例的机器翻译系统的基础。因为双语语料库中包含了两种语言互译信息特征,能够提供两种语言之间丰富的匹配信息,所以不仅在机器翻译、双语词典编纂等领域起到关键作用,而且在双语教学、跨语言文献检索等领域都有着广泛的应用前景。建设语料库的传统工艺流程繁琐、费时、耗力难以适应语言信息的变化速度,因此汉维哈柯双语平行语料库加工处理系统的实现对语料库的建设具有重要的作用。
- 吴小川吐尔根.依布拉音艾山吾买尔谭勋
- 关键词:机器翻译词语对齐
- 泛化的基于实例方法的汉语维吾尔语模板库的构建
- 机器翻译(Machine Translation)是指用计算机自动地将一种人类语言转换成另一种人类语言。作为解决人类交往障碍的有效手段,机器翻译研究受到了越来越多的重视。在不同策略的翻译方法中,基于实例的机器翻译方法具有...
- 吴小川
- 关键词:维吾尔语机器翻译
- 文献传递
- 混合策略的维吾尔语名词词干提取系统被引量:11
- 2013年
- 通过对维吾尔语名词形态结构进行研究,构造了名词有限状态自动机(FSM);针对自动机的缺陷使用最大熵模型给有限状态自动机加入了歧义词缀识别能力,根据维吾尔语的元音和谐特点,建立了基于规则和信道噪声模型的元音和谐处理方法。有机地结合以上三种方法构造出了基于规则和统计的名词词干提取方法。为了有效利用现有的资源,提高系统的性能,把基于词典的词干提取方法与规则和统计结合的名词词干提取方法相结合,从而开发出多种策略相结合的维吾尔语名词词干提取系统。该系统具有较强的鲁棒性,准确率保持95%以上。
- 早克热.卡德尔艾山吾买尔吐尔根.依布拉音帕里旦.吐尔逊吴小川
- 关键词:维吾尔语有限状态自动机噪声信道词干提取