徐红姣
- 作品数:33 被引量:114H指数:6
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家社会科学基金中国博士后科学基金中国科学技术信息研究所预研基金项目更多>>
- 相关领域:文化科学自动化与计算机技术语言文字社会学更多>>
- 多语主题词表及其应用研究被引量:1
- 2013年
- 对多语言信息进行语义层面的精确描述,为用户提供准确的跨语言信息资源,是当前多语言信息服务中必须面临和解决的实际问题。多语言主题词表正是解决这一问题的有效工具资源之一。文章首先介绍了国外三个常用多语言主题词表,然后对多语言主题词表在多语言信息自动标引和多语言信息检索两个领域中的应用情况进行了分析,说明多语言主题词表在多语言信息服务领域的潜在应用价值。
- 徐红姣张均胜王惠临
- 跨语言隐性关联知识发现方法、装置、设备和存储介质
- 本申请实施例提供了一种跨语言隐性关联知识发现方法、装置、设备和存储介质,涉及知识发现技术领域。该方法包括:分别对第一语言科技文献数据集和第二语言科技文献数据集进行关键词提取,得到第一语言关键词集和第二语言关键词集,进而对...
- 徐红姣何彦青刘志辉王莉军兰天许德山潘优
- 跨语言信息检索研究进展
- 2014年
- 文章从研究意义、研究热点和发展方向这三个角度对跨语言信息检索技术进行了较为全面的梳理。关注跨语言检索的含义和研究意义,使我们清晰地看到它从产生到发展的深刻社会需求背景和相关技术背景;关注跨语言检索的关键技术发展,使我们了解该项技术如何将繁多的网络资源用不同的语言提供给需要的用户,如何用可互换的语言形式描述相同或相似内容的信息资源;最后也是最重要的,是跨语言检索技术的未来,研究者们清醒地认识到技术和市场的关系,"从研究到实践",跨语言检索技术还有很长的路要走。建立以用户为中心、快速高质量、资源丰富、实用化多语言信息获取系统是未来的发展目标。
- 高影繁王惠临徐红姣张均胜屈鹏
- 关键词:跨语言信息检索
- 一种实用型跨语言检索查询翻译接口的设计与实现被引量:3
- 2013年
- 面对日益膨胀的多语种信息资源,跨语言信息检索已成为实现全球知识存取和共享的关键技术手段。构建一个实用型的跨语言检索查询翻译接口,可方便地嵌入任意的信息检索平台,扩展现有信息检索平台的多语言信息处理能力。该查询翻译接口采用基于最长短语、查询分类和概率词典等多种翻译消歧策略,并从查询翻译的准确性和接口的运行效率两个角度对构建的查询翻译接口进行评测,实验结果验证所采用方法具有可行性。
- 高影繁徐红姣
- 关键词:评测
- 基于跨语言文本分类的多语资源组织方法研究
- 跨语言文本分类技术是指在不需人工干预的情况下将现有的自动文本分类系统由单语言扩展到两种或多种语言。当机构或组织的文档管理部门日益依赖自动文本分类时,跨语言文本分类技术能为其解决多语种文档的归类组织问题提供支持。本文以国家...
- 高影繁徐红姣张均胜王惠临
- 关键词:快速分类算法
- 基于过滤与权重平滑策略的自动标引方法研究被引量:1
- 2014年
- 文章提出一种基于过滤和权重平滑策略的标引词自动抽取方法,该方法采用可变停用词作为文档分隔手段,采用词性、词频、词语位置等信息作为标引词过滤的手段,采用合理的权重倾向策略保证了标引词抽取在词组和单词中的均衡。方法综合利用了词性标注等自然语言处理领域的研究成果和统计学信息,不依赖词汇在文档集中的分布规律,可以直接从单篇文档抽取标引词,在待标引文档篇幅受限的情况下具有良好的运行性能。
- 高影繁徐红姣杜枫
- 关键词:自动标引
- 多语叙词表构建方法研究与实践被引量:3
- 2014年
- 多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的方法及该方法的不足进行分析,然后从汉化方法、汉语词汇的选取原则、叙词表辅助汉化平台的构建及汉化结果评价4个方面对英语EI叙词表和日语JST叙词表的汉化工作进行介绍,最后探讨下一步的研究工作。
- 徐红姣高影繁张均胜屈鹏曾文
- 基于机器翻译的专利术语翻译获取方法研究被引量:3
- 2014年
- 鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。
- 何彦青刘建辉屈鹏李颖徐红姣
- 关键词:机器翻译
- 基于平行语料的查询翻译词典改进方法研究被引量:2
- 2011年
- 面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。目标是生成一部基于句对齐平行语料的科技类双语概率词典,为跨语言检索查询翻译消歧提供实时性支持。
- 高影繁徐红姣王惠临
- 关键词:查询翻译
- 一种基于短文本相似度计算的主观题自动阅卷方法被引量:12
- 2014年
- 文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
- 张均胜石崇德徐红姣高影繁何彦青
- 关键词:相似度主观题自动阅卷