您的位置: 专家智库 > >

赵阳

作品数:22 被引量:90H指数:4
供职机构:中国科学院自动化研究所更多>>
发文基金:国家重点实验室开放基金北京市科技计划项目国家自然科学基金更多>>
相关领域:自动化与计算机技术交通运输工程语言文字文化科学更多>>

文献类型

  • 16篇专利
  • 6篇期刊文章

领域

  • 14篇自动化与计算...
  • 2篇交通运输工程
  • 1篇文化科学
  • 1篇语言文字

主题

  • 10篇翻译
  • 9篇图像
  • 6篇语言
  • 5篇机器翻译
  • 4篇电子设备
  • 4篇端到端
  • 4篇语言处理
  • 4篇源语
  • 4篇源语言
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇文本
  • 3篇单词
  • 3篇短语
  • 3篇短语翻译
  • 3篇自然语言处理...
  • 3篇字音
  • 3篇文档
  • 3篇文档图像
  • 3篇汉字

机构

  • 20篇中国科学院自...
  • 3篇北京交通大学
  • 2篇中国科学院大...
  • 1篇国家计算机网...
  • 1篇北京中科凡语...

作者

  • 22篇赵阳
  • 15篇宗成庆
  • 11篇周玉
  • 7篇张家俊
  • 2篇徐田华
  • 1篇张江
  • 1篇谢砚青
  • 1篇周星宇
  • 1篇张然
  • 1篇洪岳华
  • 1篇贺仲雄
  • 1篇刘扬
  • 1篇张旭
  • 1篇周玉平
  • 1篇赵文天

传媒

  • 2篇铁道学报
  • 1篇江西师范大学...
  • 1篇中国科学基金
  • 1篇中文信息学报
  • 1篇中国工程科学

年份

  • 1篇2025
  • 8篇2024
  • 2篇2023
  • 4篇2022
  • 1篇2021
  • 2篇2019
  • 1篇2017
  • 1篇2015
  • 1篇2014
  • 1篇2005
22 条 记 录,以下是 1-10
排序方式:
表格重建方法、装置、电子设备及存储介质
本发明提供一种表格重建方法、装置、电子设备及存储介质,应用于图像处理技术领域。该方法包括:获取表格图像;提取所述表格图像的图像特征,并根据所述图像特征确定所述表格图像的单元格类别、单元格坐标以及单元格像素掩码;根据所述单...
张亚萍庞刘成赵阳周玉宗成庆
中文拼写检错纠错方法、装置、电子设备及存储介质
本发明提供一种中文拼写检错纠错方法、装置、电子设备及存储介质,属于自然语言处理技术领域,该方法包括:将汉字输入序列输入至对比学习模型,得到对比学习模型输出的汉字输入序列中各个汉字对应的相似字向量;基于相似字向量,检测汉字...
张家俊 李鑫赵阳宗成庆
文本图像翻译模型训练方法、装置、电子设备和存储介质
本发明提供一种文本图像翻译模型训练方法、装置、电子设备和存储介质,其中方法包括:获取预训练模型和训练数据,分别对训练数据中的文本图像和源端语言文本字符串进行特征编码,得到文本图像特征和文本特征;分别对文本图像特征和文本特...
张亚萍马聪赵阳周玉宗成庆
基于多任务训练的端到端图像文本翻译方法、系统、装置
本发明属于自然语言处理技术领域,具体涉及一种基于多任务训练的端到端图像文本翻译方法,旨在解决现有的图像文本翻译模型因缺乏训练数据、模型结构设计,导致翻译性能较差的问题。本发明方法包括:获取待翻译的数据,作为输入数据;对输...
赵阳马聪张亚萍周玉
基于贝叶斯网络的高铁信号系统车载设备故障诊断方法的研究被引量:18
2014年
考虑到高铁车载设备故障诊断的不确定性和复杂性,本文提出了基于贝叶斯网络的车载设备故障诊断系统。在建立贝叶斯网络结构的过程中,基于充分利用现场数据与先验知识的思想,本文通过融合不同方法(K2算法,MCMC算法和专家知识)得到最优的贝叶斯网络结构。最后,本文进行了实例分析与模型验证,并与KNN算法、BP神经网络算法进行比较,测试结果表明该模型的正确性和有效性。文中的验证数据来自武广高铁车载设备故障追踪表。
赵阳徐田华周玉平赵文天
关键词:贝叶斯网络故障诊断高速铁路车载设备
基于神经机器翻译系统的单词预测方法及系统
本发明涉及一种基于神经机器翻译系统的单词预测方法及系统,所述单词预测方法包括:对平行语料进行训练,从训练结果中抽取,获得短语翻译表;对任意平行句对中的源语言句子进行匹配搜索,确定源语言句子中包含的全部源语言短语;从短语翻...
张家俊赵阳王亦宁宗成庆
可控文本生成方法、装置、电子设备及存储介质
本发明提供一种可控文本生成方法、装置、电子设备及存储介质,应用于自然语言处理技术领域。该方法包括:获取输入文本;确定与所述输入文本关联的至少一个知识文本;分别对所述至少一个知识文本中的每个知识文本指代消解处理,得到知识修...
赵阳任子轩宗成庆
翻译方法及装置、计算机可读存储介质及计算机程序产品
公开了一种翻译方法及装置、计算机可读存储介质及计算机程序产品,所述方法包括:将源文档图像输入图像编码器,得到图像编码特征,其中,源文档图像包括源语言文本部分和插图部分;将源文档图像输入语义对齐编码器,得到单模态语义编码特...
梁雨普张亚萍赵阳向露宗成庆周玉
端到端文档图像翻译方法及装置
本发明提供一种端到端文档图像翻译方法及装置,该方法包括:对文档图像进行光学字符识别编码,得到图像编码特征,对文档图像进行版面感知编码,得到版面编码特征;根据门控机制对图像编码特征和版面编码特征进行特征加权融合,得到融合特...
梁雨普张亚萍赵阳向露宗成庆周玉
融入置信度的文本图像翻译研究
2024年
文本图像翻译旨在将嵌在图像中的源端语言文本翻译成目标语言。文本图像翻译系统通常由相互独立的光学字符识别(Optical Character Recognition,OCR)和机器翻译(Machine Translation,MT)模型级联组成。OCR模型将文本图像识别成转录文本,MT模型将转录文本翻译成目标语言。由于OCR模型转录文本存在噪声,而MT模型对噪声文本表现不佳,文本图像翻译系统性能远不如纯文本机器翻译系统。为缓解噪声文本带来的问题,鲁棒性机器翻译主要采用以下两种方法:(1)使用合成噪声文本,以模拟OCR转录带来的噪声;(2)利用干净文本和噪声文本的对比学习,拉近噪声文本和干净文本的分布。未能考虑以下问题:(1)忽视来自OCR模型的置信度信息,未能考虑OCR和MT系统的有效融合;(2)仅采用合成噪声,类型单一,无法覆盖实际噪声类型;(3)仅采用句子粒度的粗粒度对比损失,忽略细粒度的词的对比信息。为解决上述问题,该文提出一种融合置信度信息的文本图像翻译方法,充分利用转录文本中每个字符输出的概率分布,得到每个词的置信度信息,使级联式文本图像翻译系统中的OCR模型和机器翻译模型产生更有效的融合;同时针对OCR转录文本的噪声特点,设计了一种能提供词粒度的对比信息的监督文本,进一步提升模型性能。实验表明,该文所提方法在中译英以及英中文本图像翻译任务上相较于传统的管道式模型得到了显著提升。
伍凌辉马聪周玉韩旭赵阳赵阳
关键词:置信度
共3页<123>
聚类工具0