搜索到9658篇“ 机器翻译“的相关文章
- 文档级神经机器翻译综述
- 2025年
- 机器翻译(machine translation,MT)研究旨在构建一个自动转换系统,将给定源语言序列自动地转换为具有相同语义的目标语言序列.由于机器翻译广阔的应用场景,使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向.近年来,端到端的神经机器翻译(neural machine translation,NMT)方法显著超越了统计机器翻译(statistical machine translation,SMT)方法,成为目前机器翻译研究的主流方法.然而,神经机器翻译系统通常以句子为翻译单位,在面向文档的翻译场景中,将文档中每个句子独立地进行翻译,会因脱离文档的篇章语境引起一些篇章级的错误,如词语错翻、句子间不连贯等.因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法,文档级的神经机器翻译(document-level neural machine translation,DNMT)的目标正是如此,成为机器翻译研究的热门方向.调研了近年来在文档级神经机器翻译研究方向的主要工作,从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述,目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向.同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战,希望能带给研究者们一些启发.
- 吕星林李军辉陶仕敏杨浩张民
- 融合知识的对话机器翻译研究
- 2025年
- 对话机器翻译是面向跨语言或多语言真实场景的对话翻译技术(图1),其在推动人类文明交流、消除语言障碍、提高跨语言沟通效率以及促进外贸发展等方面具有深远的意义和社会价值。然而,对话机器翻译研究依然存在如下挑战:①在建模对话连贯性、角色偏好、翻译一致性方面依然存在着许多不足,这导致现有的机器翻译模型常常输出连贯性和一致性较差的对话翻译译文;②由于对话翻译数据标注的难度大,成本高,使得现有的对话翻译数据规模较小,这就导致训练得到的机器翻译模型缺乏相应的对话领域内知识。
- 徐金安梁云龙
- 关键词:机器翻译沟通效率跨语言语言障碍
- 神经机器翻译中课程学习研究综述
- 2025年
- 课程学习作为一种新兴技术,近年来逐渐受到关注,它符合人类的学习习惯,由简到难、由浅至深。其核心思想是让模型从简单的、基础的概念开始学习,逐渐过渡到更复杂、更高层次的内容。在神经机器翻译中,课程学习作为一种训练策略,旨在帮助模型按照一定规律学习。课程学习现已被证明可以加速模型收敛,提高模型翻译质量和稳定性。从机器学习的角度介绍了课程学习的定义及其基础框架,并进一步探讨了课程学习在神经机器翻译领域中的应用。从样本难度评估与模型训练调度策略两个方面,详细阐述了预定义课程学习和动态课程学习两种方法。预定义课程学习通过事先确定样本的难度顺序,引导模型从简单到复杂的任务逐步学习;而动态课程学习则依据模型当前的学习状态动态调整样本的难度,提供了更灵活的训练方式。分析了课程学习在神经机器翻译领域的未来研究趋势,并提出了三个值得进一步探索的研究方向。
- 胡春月斯琴图王斯日古楞
- 关键词:课程学习
- 一种运用词性信息的机器翻译方法
- 本发明公开了一种运用词性信息的机器翻译方法,其特点是使用包含对应词性标签的双语语料的训练集,在翻译模型训练完成后,利用词性信息辅助机器翻译;所述翻译模型包括共享编码器、解码器和词性分类器,且以不同的方式导入词性信息,增强...
- 赵静潘凌超孙仕亮
- 篇章机器翻译方法及装置、存储介质
- 本公开是关于一种篇章机器翻译方法及装置、存储介质。该方法包括:识别篇章内的实体词;将所述实体词用占位符替换篇章内原始语句,得到包含所述占位符的替换语句,其中,不同所述实体词的占位符不同;将所述替换语句和从所述原始语句抽取...
- 李响孙于惠崔建伟
- 基于混合模型的机器翻译优化方法
- 2025年
- 预训练语言模型通过学习大量文本数据中的语言模式和结构,展现出对自然语言任务的通用处理能力。通常,为了机器翻译任务而专门训练预训练模型,需要耗费大量的计算资源。为了解决这一问题,文章提出了一种新的混合模型,该模型将BERT、ROBERTA、ELECTRA和LUKE等预训练模型与Marian神经机器翻译模型相结合。该方法的目的是利用其他领域的预训练模型与机器翻译模型相结合,以低成本构建新的预训练机器翻译模型。实验结果表明,混合模型在多个语言数据集上比直接使用Marian模型进行微调BLEU值平均提升5.53,最高提升了16.05。结果显示,结合预训练模型和Marian,以低成本构建混合模型,可以有效提升机器翻译性能。
- 张乐荆晓远孙其航
- 关键词:自然语言处理混合模型机器翻译
- 一种应用于机器翻译的知识融合方法
- 本发明公开一种应用于机器翻译的知识融合方法,步骤为:使用双语语料库进行训练一个或多个神经机器翻译模型作为知识的提供者,也就是教师模型;对语料库中的源语S进行翻译和教师模型知识提取;进行知识的融合;复制源语S,并进行拼接,...
- 杨迪毕东
- 基于术语保护的机器翻译方法及装置
- 本发明提供一种基于术语保护的机器翻译方法及装置,通过搜集海量平行语料,对其进行分词,得到第一集合,并将其输入训练后的IBM Model模型中,输出词对齐概率;根据词对齐概率,对原文中的词进行特殊符号的替换,对译文中的词进...
- 朱宪超韩冰
- 基于修辞结构的篇章级神经机器翻译
- 2025年
- 虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。
- 姜云卓贡正仙
- 关键词:篇章分析篇章翻译修辞结构理论
- 一种基于文章分类的机器翻译方法及系统
- 本发明提供一种基于文章分类的机器翻译方法及系统,该方法的步骤包括:接收待处理的语句集合,所述语句集合中包括待翻译的语句;基于预设置的分类器对待翻译的语句进行分类,基于每个分类的类别构建对应类别的语句类集合;基于对应每个类...
- 耿国桐雷帅陈银娣郑惠文王三勇吕雁飞李彩军
相关作者
- 余正涛

- 作品数:890被引量:1,254H指数:15
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 机器翻译 语料 跨语言
- 赵铁军

- 作品数:407被引量:1,090H指数:16
- 供职机构:哈尔滨工业大学
- 研究主题:机器翻译 自然语言处理 翻译 统计机器翻译 文本
- 刘群

- 作品数:210被引量:1,628H指数:19
- 供职机构:中国科学院计算技术研究所
- 研究主题:机器翻译 统计机器翻译 翻译模型 自然语言处理 源语言
- 宗成庆

- 作品数:233被引量:526H指数:14
- 供职机构:中国科学院自动化研究所
- 研究主题:机器翻译 源语言 句子 统计机器翻译 电子设备
- 黄河燕

- 作品数:311被引量:1,397H指数:19
- 供职机构:北京理工大学
- 研究主题:机器翻译 自然语言处理 语料 自然语言处理技术 向量表示