翟飞飞
- 作品数:9 被引量:0H指数:0
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 口语对话中冗余词汇识别方法研究
- 2011年
- 冗余现象是口语对话中普遍存在的特殊语言现象之一,它的存在常常会影响口语句子的理解和翻译。该文基于真实口语对话语料对冗余现象进行了分析,并在词汇层面对冗余现象进行了分类,然后对口语中的冗余词汇进行了统计识别方法研究。通过对冗余词汇处理前后的口语句子翻译实验,结果表明,预先对冗余现象进行处理,能够改善口语翻译的译文质量。
- 翟飞飞宗成庆
- 关键词:冗余现象最大熵分类器支持向量机条件随机场
- 基于Schema约束的空管领域知识抽取方法
- 2025年
- 当前大多数知识抽取方法采用两阶段方式,存在一定的误差传递情况;生成式知识抽取方法由于本身的模型特点,导致生成的结构具有一定的不可控性。鉴于此,提出了一种基于知识框架Schema约束的生成式知识抽取方法。该方法以生成式预训练语言模型T5为基座模型,通过预先定义的知识框架结构来引导模型一步生成包含在数据中的所有嵌套性结构知识。试验结果表明,该方法能够精确抽取包含在数据里的所有知识。
- 孙建徐秋程汤闻易翟飞飞周玉
- 关键词:知识抽取
- 构建树结构及基于树结构的机器翻译系统的方法
- 本发明涉及一种构建树结构及基于相应树结构的机器翻译系统的方法,所述方法包括如下步骤:对所述双语语料中的双语句子对进行分词、词性标注和词对齐;根据所述词对齐的结果,对所述双语句子对进行双语切分,生成比双语句子对长度更短的双...
- 宗成庆翟飞飞
- 一种基于谓词论元结构的统计机器翻译方法
- 本发明涉及一种基于谓词论元结构的统计机器翻译方法,所述方法包括如下步骤:对双语语料中的双语句子对进行分词、自动词对齐、句法分析以及双语联合语义角色标注;根据所述双语联合语义角色标注的结果,抽取所述双语句子对的PAS转换规...
- 宗成庆翟飞飞张家俊周玉
- 构建树结构及基于树结构的机器翻译系统的方法
- 本发明涉及一种构建树结构及基于相应树结构的机器翻译系统的方法,所述方法包括如下步骤:对所述双语语料中的双语句子对进行分词、词性标注和词对齐;根据所述词对齐的结果,对所述双语句子对进行双语切分,生成比双语句子对长度更短的双...
- 宗成庆翟飞飞
- 多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告
- 本文是中科院自动化所参加CWMT2011机器翻译系统评测的技术报告。在本次评测中我们一共参加了九个项目的评测任务,包括汉英新闻领域机器翻译、英汉新闻领域机器翻译、英汉科技领域机器翻译、日汉新闻领域机器翻译、蒙汉日常用语机...
- 周玉翟飞飞张家俊涂眉陈钰枫宗成庆
- 关键词:翻译模型
- 一种基于谓词论元结构的统计机器翻译方法
- 本发明涉及一种基于谓词论元结构的统计机器翻译方法,所述方法包括如下步骤:对双语语料中的双语句子对进行分词、自动词对齐、句法分析以及双语联合语义角色标注;根据所述双语联合语义角色标注的结果,抽取所述双语句子对的PAS转换规...
- 宗成庆翟飞飞张家俊周玉
- 多语言文本机器翻译系统-中科院自动化所CWMT2011评测技术报告
- 本文是中科院自动化所参加CWMT2011机器翻译系统评测的技术报告。在本次评测中我们一共参加了九个项目的评测任务,包括汉英新闻领域机器翻译、英汉新闻领域机器翻译、英汉科技领域机器翻译、日汉新闻领域机器翻译、蒙汉日常用语机...
- 周玉翟飞飞张家俊涂眉陈钰枫宗成庆
- 关键词:翻译模型
- 汉英双向时间和数字命名实体的识别与翻译系统
- 时间和数字命名实体的识别与翻译是统计机器翻译中语料预处理任务的一个重要步骤,对后续的模型训练和系统性能有重要的影响.本文在考虑汉英两种语言中时间和数字命名实体构成规律的基础上,将其进行了类别划分并分别制定了相应的识别和翻...
- 翟飞飞夏睿周玉宗成庆
- 关键词:机器翻译识别技术翻译原则