刘洋
- 作品数:42 被引量:132H指数:6
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字经济管理文化科学更多>>
- 机器翻译评测中的模糊匹配被引量:11
- 2005年
- 目前,大多数机器翻译自动评测方法都没有考虑在未匹配的词语中可能包含被忽略的信息。本文提出一种在参考译文和待评测译文之间自动搜索模糊匹配词对的方法,并给出相似度的计算方法。模糊匹配和计算相似度的整个过程将通过一个例子进行说明。实验表明,我们的方法能够较好地找到被忽略的、有意义的词对。更重要的是,通过引入模糊匹配,BLEU的性能得到显著的提高。模糊匹配可以用来提高其他机器翻译自动评测方法的性能。
- 刘洋刘群林守勋
- 关键词:人工智能机器翻译机器翻译评测
- 面向层次短语翻译的词汇化调序方法研究被引量:6
- 2012年
- 词汇化信息在短语调序中有重要的作用。然而层次短语翻译模型调序时并不考虑变量所泛化的短语的词汇化信息,因此该模型调序的歧义性较大。为此该文提出面向层次短语模型的词汇化调序方法。我们定义变量与邻接词语的调序关系,并使用变量所泛化短语片段的边界词信息来指导调序。在大规模语料的汉语到英语翻译评测任务中,我们的方法在NIST 2003-2005测试数据上获得了0.6~1.2BLEU值的提高。
- 肖欣延刘洋刘群林守勋
- 关键词:统计机器翻译
- ACL2007会议观感被引量:1
- 2007年
- 刘群刘洋
- 关键词:计算语言学自然语言处理ACI
- 一种机器翻译自动评测方法及其系统
- 本发明公开了一种机器翻译自动评测方法及其系统。该方法在至少一篇参考译文中查找机器翻译系统的输出译文的匹配子片断,然后根据这些匹配子片断及其长度计算熵,以及计算长度惩罚系数和匹配比例惩罚系数,最后获得一个评分作为评价指标。...
- 刘群刘洋
- 文献传递
- 2005统计机器翻译研讨班研究报告被引量:12
- 2006年
- 2005年7月13日至15日,中国科学院自动化研究所、计算技术研究所和厦门大学计算机系联合举办了我国首届统计机器翻译研讨班。本文主要介绍本次研讨班参加单位的测试系统和实验结果,并给出相应的分析。测试结果表明,我国的统计机器翻译研究起步虽晚,但已有快速进展,参评系统在短期内得到了较好的翻译质量,与往年参加863评测的基于规则方法的系统相比性能虽还有差距,但差距已经不大。从目前国际统计机器翻译研究的现状和发展趋势来看,随着数据资源规模的不断扩大和计算机性能的迅速提高,统计机器翻译还有很大的发展空间。在未来几年内,在基于短语的主流统计翻译方法中融入句法、语义信息,必将成为机器翻译发展的趋势。
- 徐波史晓东刘群宗成庆庞薇陈振标杨振东魏玮杜金华陈毅东刘洋熊德意侯宏旭何中军
- 关键词:人工智能机器翻译统计机器翻译机器翻译评测
- 串行压缩单元、深度神经网络加速器
- 本发明提出一种串行压缩单元、深度神经网络加速器,该加速器的每一处理元件包含串行压缩单元与计算单元,其中:该串行压缩单元包含异步电路握手模块与锁存模块,相邻串行压缩单元的异步电路握手模块彼此之间串行连接,且每一异步电路握手...
- 陈云霁刘洋赵永威杜子东郭崎
- 面向Internet的中文新词语检测被引量:77
- 2004年
- 随着社会的飞速发展 ,新词语不断地在日常生活中涌现出来。搜集和整理这些新词语 ,是中文信息处理中的一个重要研究课题。本文提出了一种自动检测新词语的方法 ,通过大规模地分析从Internet上采集而来的网页 ,建立巨大的词和字串的集合 ,从中自动检测新词语 ,而后再根据构词规则对自动检测的结果进行进一步的过滤 ,最终抽取出采集语料中存在的新词语。根据该方法实现的系统 ,可以寻找不限长度和不限领域的新词语 ,目前正应用于《现代汉语新词语信息 (电子 )词典》的编纂 ,在实用中大大的减轻了人工查找新词语的负担。
- 邹纲刘洋刘群孟遥于浩西野文人亢世勇
- 关键词:计算机应用中文信息处理新词语
- 基于树到树翻译模型的翻译规则抽取方法和翻译方法
- 本发明提供一种基于树到树翻译模型的翻译规则抽取方法,包括下列步骤:1)、分析训练语料中的源语言串和目标语言串并输出训练语料的源语言压缩共享句法森林和训练语料的目标语言压缩共享句法森林;2)、根据所述训练语料的源语言压缩共...
- 刘洋吕亚娟刘群熊皓
- 文献传递
- 机器翻译评测中的模糊匹配
- 目前的大多数机器翻译自动评测方法都没有考虑在未匹配的词语中可能包含被忽略的信息。本文提出一种在参考译文和待评测译文之间自动搜索模糊匹配词对的方法,并给出了相似度的计算方法。模糊匹配和计算相似度的过程将通过一个例子进行说明...
- 刘洋刘群
- 关键词:机器翻译评测
- 文献传递
- 863计划中文信息处理与智能人机接口基础数据库的设计和实现被引量:4
- 2005年
- 本文简单分析了中文信息处理与智能人机接口领域基础数据建设的意义以及国内外的现状,重点介绍了863计划中文信息处理与智能人机接口领域基础数据库的设计与实现,并对基础数据的应用和今后的工作设想进行了讨论.
- 钱跃良林守勋刘群刘洋刘宏谢萦
- 关键词:中文信息处理人机接口基础数据库863计划能人