于薇
- 作品数:12 被引量:39H指数:3
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家社会科学基金中国科学技术信息研究所预研基金项目中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理语言文字更多>>
- 档案领域词表自动化辅助构建及知识组织应用探析被引量:6
- 2018年
- 本文针对目前主题词表在实际应用中存在的词汇老化、结构陈乏,以及无法适应当前知识服务等问题,应用知识组织的方法对新型档案领域词表的构建进行研究,并在此基础上,从实际应用角度对档案知识组织体系构建及可开展的知识服务形式进行探究,所提出的档案领域词表具备可扩展性,其完善的知识体系、智能化的分析、个性化的服务能够有效提高档案服务的效率和能力,更好地发挥电子档案的社会价值。
- 张昱于薇
- 关键词:知识组织知识服务档案
- 句子对齐技术研究进展
- 近年来,由于统计方法在自然语言处理领域得到广泛运用,大规模语料库的作用得以凸显。其中,大规模的双语对齐语料库因为包含有两种不同语言之间的互译对照信息而在机器翻译、双语词典编撰、术语抽取、跨语言信息检索和计算机辅助翻译等自...
- 何彦青于薇王惠临
- 关键词:句子对齐词典机器翻译
- 面向科研信息资源整合的元数据协同方法研究被引量:4
- 2017年
- 针对科研信息资源整合利用问题,利用元数据协同的方法为已有科研信息资源系统的整合与共享利用提供解决方案。以论文、专利、科技报告为例,把表示相同语义的元数据整合到一个体系下,形成子体系,将多个子体系整合到一个网络中,形成元数据映射网络。结果表明,元数据协同方法在保持原有元数据标准不变的前提下,可以通过语义层面的映射来解决不同科研信息资源的整合与利用问题,对解决科研信息资源整合具有比较现实的意义。
- 于薇
- 关键词:元数据
- 机器翻译系统融合方法及其应用探究
- 2011年
- 多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。
- 何彦青石崇德于薇张均胜王惠临
- 关键词:机器翻译自然语言处理
- 融通创新模式及其支撑体系构建——荷兰人工智能创新中心对我国人工智能领域发展的启示被引量:22
- 2020年
- 针对人工智能、量子信息等兼具渗透性、扩散性、颠覆性等特征的新动能将引领新时代科技进步和产业发展,甚至有可能重塑全球产业体系和经济发展方式,我国提出建立融通创新模式,以支撑经济高质量发展。在上述背景下,首先,尝试从科学研究与应用实践角度分析融通创新的概念和内涵,进一步构建对应的支撑体系,即形成以政府主办的科技中介服务机构为关键节点,连通企业、高校、研究院所、政府等各类创新主体的共同体网络。其次,结合2019年对荷兰人工智能创新服务中心(ICAI)的实地调研,进一步验证构建上述支撑体系对于实现融通创新的可行性和操作性。最后,就我国人工智能领域构建融通创新发展模式加以探讨,并提出4条实施策略。
- 袁伟高继平于薇邵英红
- 关键词:支撑体系人工智能
- 基于串频统计的汉语和孟加拉语专有名词识别被引量:2
- 2011年
- 基于Nagao串频统计算法实现汉语和孟加拉语专有名词的识别。提取未经过词性标注的中文和孟加拉语语料中的的n元串,使用改进的SSR算法过滤多余子串,利用字串的相邻字信息计算所有n元串成为专有名词的概率,并据此筛选专有名词。最后,实现基于串频统计的跨语言专有名词识别系统。实验表明,系统能够从输入的生语料中有效地识别出人名、地名、团体机构名等。
- 柯修王惠临于薇
- 关键词:专有名词识别串频统计
- Backcasting在情报学发展研究中应用的探讨
- 随着知识经济的到来,社会的发展越来越依赖于情报资源,情报学界对情报学发展去向研究的呼声越来越高,因此对于情报学中长期发展规划的研究也就显得非常有意义。在这种背景下,本文借鉴预测学中新近提出的回溯预测方法的思想,对情报学未...
- 于薇
- 关键词:情报学
- 文献传递
- 中国科学技术信息研究所CWMT'2011技术报告
- 本文介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了荚汉科技领域的机器翻译评测项目。本文阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能...
- 何彦青石崇德于薇张均胜王惠临
- 关键词:机器翻译自然语言处理
- 文献传递
- 基于跨语言文本分类的多语资源组织方法研究
- 2011年
- 文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系统奠定了基础。
- 高影繁徐红姣于薇王惠临
- 关键词:文本分类翻译词典信息资源
- “中日两国机器翻译技术合作研讨会”综述被引量:1
- 2011年
- 文章介绍了“中日两国机器翻译技术合作研讨会”的召开背景和会议概要。其中,重点介绍与会议相关的日本“日中·中日语言处理技术的开发研究”项目,以及在本次会议中基于实例的机器翻译技术创始人长尾真先生的主旨发言内容。最后,对会议取得的成果予以总结。
- 李颖于薇张均胜