您的位置: 专家智库 > >

国家自然科学基金(61303152)

作品数:10 被引量:31H指数:4
相关作者:李颖何彦青屈鹏高影繁徐红姣更多>>
相关机构:中国科学技术信息研究所科学技术振兴机构同志社大学更多>>
发文基金:国家自然科学基金中日国际合作项目国际科技合作与交流专项项目更多>>
相关领域:文化科学自动化与计算机技术化学工程语言文字更多>>

文献类型

  • 10篇中文期刊文章

领域

  • 5篇文化科学
  • 3篇自动化与计算...
  • 2篇化学工程
  • 1篇语言文字

主题

  • 4篇机器翻译
  • 4篇翻译
  • 3篇对齐
  • 3篇指标体系
  • 2篇药物
  • 2篇制药
  • 2篇生物技术
  • 2篇主题
  • 2篇NIH
  • 1篇多义
  • 1篇信息检索
  • 1篇信息匹配
  • 1篇应急
  • 1篇应急管理
  • 1篇语料
  • 1篇语料库
  • 1篇语义角色
  • 1篇语义角色标注
  • 1篇知识库
  • 1篇制药行业

机构

  • 10篇中国科学技术...
  • 2篇同志社大学
  • 2篇科学技术振兴...
  • 1篇北京联合大学
  • 1篇河北地质大学

作者

  • 6篇李颖
  • 5篇何彦青
  • 3篇屈鹏
  • 2篇高影繁
  • 2篇徐红姣
  • 1篇张娟
  • 1篇王惠临
  • 1篇石崇德
  • 1篇王莉军
  • 1篇吴广印
  • 1篇刘建辉
  • 1篇孙瑶
  • 1篇丁亮

传媒

  • 3篇图书情报工作
  • 3篇情报工程
  • 2篇情报理论与实...
  • 1篇情报科学
  • 1篇中国科技资源...

年份

  • 1篇2019
  • 3篇2016
  • 2篇2015
  • 4篇2014
10 条 记 录,以下是 1-10
排序方式:
基于语义角色标注的专利主题提取研究被引量:4
2014年
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。
孟令恩李颖何彦青屈鹏王惠临
关键词:语义角色标注主题抽取
基于机器翻译的专利术语翻译获取方法研究被引量:3
2014年
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。
何彦青刘建辉屈鹏李颖徐红姣
关键词:机器翻译
开放环境科技语料库质量评价研究被引量:5
2016年
[目的/意义]研究开放环境下科技语料库的质量评价问题。[方法/过程]通过整理已有相关研究和理论分析,提出一套具有代表性、规模、正确性、稳定性和开放性5个一级指标的评价指标体系。其中,领域代表性(代表性的二级指标)使用统计量度量,开放性分为多样性和使用量两个二级指标,多样性使用信息熵度量。在4个开放语料库和1个自建语料库上检验统计量和信息熵在实际评价中的表现,并通过数据分析说明这两个指标不具有统计学意义上的相关性。[结果/结论]研究结果可用于图书馆和科技信息服务机构内以科技文献为基础进行语料库建设过程中的评价与质量控制。
屈鹏
关键词:语料库指标体系
2015全国机器翻译研讨会ISTIC评测报告被引量:3
2016年
中国科学技术信息研究所(ISTIC)机器翻译研发工程历史悠久,几经变迁。本文在回顾ISTIC机器翻译发展历史的基础上,介绍了最近参加第十一届全国机器翻译研讨会机器翻译评测(简称CWMT’2015)系统的具体表现。CWMT’2015评比中,ISTIC参加了维汉、藏汉、蒙汉三个机器翻译评测项目。本文阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现。
何彦青孟令恩丁亮石崇德李颖王莉军孙瑶
关键词:机器翻译
基于领域知识库的科技术语信息匹配模型研究被引量:6
2019年
【目的/意义】全面分析中外科技文献可以把握当前某个领域或主题的研究热点和研究趋势,为了应对机器翻译在分析海量外文科技文献时存在的科技术语翻译'领域不一致'问题,需要对科技术语信息匹配进行研究。【方法/过程】提出了一种基于领域知识库的科技术语信息匹配模型,通过利用领域知识库构建领域多义术语词典,为科技术语匹配更多翻译候选,并结合语言学特征、领域信息以及LSTM语言模型来挑选最合适译文。【结果/结论】用化工领域的数据进行测试,验证模型的有效性,为深入分析外文文献中的技术理论提供了可靠又便捷的方法。
孙玥莹何彦青吴广印
关键词:信息匹配机器翻译领域知识库
主题图在突发事件应急信息分析中的应用研究被引量:8
2016年
对突发事件进行快速有效的识别和分析处理,对信息需求者得出合理的应对策略是非常有价值的。文章以主题图为工具,充分利用主题图灵活的知识组织和信息导航优势,将复杂事件按照不同的视角进行主题和主题关联抽取,降低了知识结构的构建难度;同时,利用主题图合并技术,合并不同主题图中的相同或相似主题、主题关联,从而使得复杂事件整体知识结构的还原成为可能。基于主题图的信息组织方法为突发事件应急中的信息分析提供了新的思路,也是文章的新颖性所在。
高影繁李颖孟令恩
关键词:突发事件应急管理主题图
实用型跨语言检索查询翻译接口性能改进研究被引量:2
2014年
针对某网站在线运行的基于词典的查询翻译接口,对接口中实现的3种比较常用的查询翻译消歧算法进行改进,利用性能测试工具Loadrunner对改进前后的查询翻译接口的运行效率进行对比分析,最后总结影响基于词典的查询翻译的运行效率的3个主要因素。
徐红姣高影繁
关键词:查询翻译跨语言信息检索
治部,连载,面向日本版NIH建立新指标体系——之一 基于新指标体系的制药产业现状俯瞰与未来预测
2015年
日本版NIH及其制药企业,政策制定·战略规划需要佐证。为此,本研究尝试基于新的指标体系进行制药产业的现状俯瞰与未来预测。连载第一篇,着眼于制药产业研究开发的pipeline,即在研药物。按照研究开发阶段来梳理pipeline,通过与已上市药物数量的比较,显然可以把握各国目前及未来的研发能力。该结果凸现出了美国在研发中的优势,以及日本的特异性等。
治部真里李颖长部喜幸
关键词:生物制药生物技术
治部,连载,面向日本版NIH建立新指标体系——之二 制药行业特定技术的俯视与未来预测
2015年
日本版NIH及其制药企业,政策制定·战略规划需要佐证。为此,本研究尝试基于新的指标体系进行制药产业的现状俯瞰与未来预测。连载第二篇,着眼于可望今后成长的生物药物,从不同的技术观点来分析各国的强项与弱项。其结果重新认识了美国在生物药物研发中的优势。同时表明,日本研发中的某些领域可以期待。
治部真里李颖长部喜幸
关键词:生物药物生物技术
子句对齐及其在专利统计机器翻译中的应用
2014年
针对专利文献句子偏长的特点,将统计机器翻译中的训练语料进行子句切割获取双语的子句序列,再采用统计和规则相结合的策略来生成子句对齐,建立基于简单子句的双语语料来重新训练统计机器翻译系统,在一定程度上改善了原有双语训练语料中的短语对齐和词对齐,可以更为深入地利用平行语料中蕴含的翻译信息,应用于专利统计机器翻译中,在NTCIR-9的测试集上进行实验比较,获得较为满意的翻译效果。
何彦青张娟
关键词:词对齐统计机器翻译
共1页<1>
聚类工具0