徐红姣
- 作品数:33 被引量:116H指数:6
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家社会科学基金中国博士后科学基金中国科学技术信息研究所预研基金项目更多>>
- 相关领域:文化科学自动化与计算机技术语言文字社会学更多>>
- 多语主题词表及其应用研究被引量:1
- 2013年
- 对多语言信息进行语义层面的精确描述,为用户提供准确的跨语言信息资源,是当前多语言信息服务中必须面临和解决的实际问题。多语言主题词表正是解决这一问题的有效工具资源之一。文章首先介绍了国外三个常用多语言主题词表,然后对多语言主题词表在多语言信息自动标引和多语言信息检索两个领域中的应用情况进行了分析,说明多语言主题词表在多语言信息服务领域的潜在应用价值。
- 徐红姣张均胜王惠临
- 跨语言隐性关联知识发现方法、装置、设备和存储介质
- 本申请实施例提供了一种跨语言隐性关联知识发现方法、装置、设备和存储介质,涉及知识发现技术领域。该方法包括:分别对第一语言科技文献数据集和第二语言科技文献数据集进行关键词提取,得到第一语言关键词集和第二语言关键词集,进而对...
- 徐红姣何彦青刘志辉王莉军兰天许德山潘优
- 跨语言信息检索研究进展
- 2014年
- 文章从研究意义、研究热点和发展方向这三个角度对跨语言信息检索技术进行了较为全面的梳理。关注跨语言检索的含义和研究意义,使我们清晰地看到它从产生到发展的深刻社会需求背景和相关技术背景;关注跨语言检索的关键技术发展,使我们了解该项技术如何将繁多的网络资源用不同的语言提供给需要的用户,如何用可互换的语言形式描述相同或相似内容的信息资源;最后也是最重要的,是跨语言检索技术的未来,研究者们清醒地认识到技术和市场的关系,"从研究到实践",跨语言检索技术还有很长的路要走。建立以用户为中心、快速高质量、资源丰富、实用化多语言信息获取系统是未来的发展目标。
- 高影繁王惠临徐红姣张均胜屈鹏
- 关键词:跨语言信息检索
- 一种实用型跨语言检索查询翻译接口的设计与实现被引量:3
- 2013年
- 面对日益膨胀的多语种信息资源,跨语言信息检索已成为实现全球知识存取和共享的关键技术手段。构建一个实用型的跨语言检索查询翻译接口,可方便地嵌入任意的信息检索平台,扩展现有信息检索平台的多语言信息处理能力。该查询翻译接口采用基于最长短语、查询分类和概率词典等多种翻译消歧策略,并从查询翻译的准确性和接口的运行效率两个角度对构建的查询翻译接口进行评测,实验结果验证所采用方法具有可行性。
- 高影繁徐红姣
- 关键词:评测
- 基于跨语言文本分类的跨语言特征提取方法研究被引量:2
- 2011年
- 随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础。
- 高影繁王惠临徐红姣
- 关键词:特征提取
- 双语句对翻译众包辅助平台设计与实现被引量:3
- 2017年
- 本文提出了一种采用众包工作模式的科技领域日汉机器翻译辅助平台的构建方法。在充分调研众包生产模式、质量控制等研究和实践的基础上,设计了集用户管理、团队管理、语料管理、机器辅助翻译、术语辅助翻译等功能为一体的双语句对生产平台,针对不同角色和不同技术类别分别构建出相应的功能模块。该平台在众包工作模式的基础上结合了多源信息辅助译者完成翻译,翻译效率高且翻译成本低,平台的开发和运行为科技领域实用型日汉机器翻译系统的建设提供了有力支撑。
- 高影繁李辉徐红姣崔笛
- 关键词:众包
- 服务于科技大数据情报分析的方法及工具研究被引量:8
- 2019年
- 【目的/意义】计算机技术的发展给情报学,特别是情报分析的方法带来了冲击和变化,传统的情报分析方法面对时代的发展和技术进步的事实,需要新方法和新技术充实到科技情报分析的工作中,情报分析的技术和工具需要更具实用性和应用性。【方法/过程】本文以科技大数据为视角和分析对象,对国内外的科技情报分析方法,工具及存在的问题进行分析,并提出面向科技大数据情报分析服务的方法,阐述方法的设计及工具研发过程。【结果/结论】本文以科技政策数据为实例,介绍科技政策数据分析的方法,设计并构建科技政策数据分析工具实现数据分析过程,验证了本文提出方法的有效性。
- 曾文车尧张运良张运良
- 关键词:情报分析术语抽取
- 基于跨语言文本分类的多语资源组织方法研究
- 跨语言文本分类技术是指在不需人工干预的情况下将现有的自动文本分类系统由单语言扩展到两种或多种语言。当机构或组织的文档管理部门日益依赖自动文本分类时,跨语言文本分类技术能为其解决多语种文档的归类组织问题提供支持。本文以国家...
- 高影繁徐红姣张均胜王惠临
- 关键词:快速分类算法
- 基于过滤与权重平滑策略的自动标引方法研究被引量:1
- 2014年
- 文章提出一种基于过滤和权重平滑策略的标引词自动抽取方法,该方法采用可变停用词作为文档分隔手段,采用词性、词频、词语位置等信息作为标引词过滤的手段,采用合理的权重倾向策略保证了标引词抽取在词组和单词中的均衡。方法综合利用了词性标注等自然语言处理领域的研究成果和统计学信息,不依赖词汇在文档集中的分布规律,可以直接从单篇文档抽取标引词,在待标引文档篇幅受限的情况下具有良好的运行性能。
- 高影繁徐红姣杜枫
- 关键词:自动标引
- 多语叙词表构建方法研究与实践被引量:3
- 2014年
- 多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的方法及该方法的不足进行分析,然后从汉化方法、汉语词汇的选取原则、叙词表辅助汉化平台的构建及汉化结果评价4个方面对英语EI叙词表和日语JST叙词表的汉化工作进行介绍,最后探讨下一步的研究工作。
- 徐红姣高影繁张均胜屈鹏曾文