任函
- 作品数:12 被引量:33H指数:4
- 供职机构:广东外语外贸大学更多>>
- 发文基金:国家自然科学基金中国博士后科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 汉英篇章结构平行语料库的对齐标注评估被引量:4
- 2017年
- 汉英篇章结构平行语料库是为汉英翻译文本标注对齐篇章结构信息的语料库,对齐标注是其核心工作,基本原则是"结构对齐、关系对齐"。该文基于所开发的对齐标注平台,进行人工对齐标注实验,提出切分对齐、结构对齐、关系对齐、连接词对齐、关系角色与中心对齐等对齐标注任务的评估方法,并给出评估分析。实验表明,对齐标注是构建汉英篇章结构平行语料库的合理、有效工作方式。
- 冯文贺李艳翠任函周国栋
- 关键词:篇章结构平行语料库
- 基于协同训练的文本蕴含识别被引量:1
- 2014年
- 针对文本蕴含的训练数据不足的问题,该文提出了基于协同训练的文本蕴含识别方法。该方法利用少量已标注的蕴含数据和大量未标注数据进行协同训练。为此,该文利用改写视图和评估视图,从结构和非结构两个角度考察蕴含关系,并将语义树核分类器和基于统计特征的分类器应用于两个视图,同时利用协同训练的结果训练一个综合分类器,用于对新数据进行预测。实验表明,基于协同训练的蕴含识别方法能在少量训练数据的情况下获得较好的识别性能。
- 任函万菁吴泓缈冯文贺
- 文本蕴涵识别及其在问答系统中的应用
- 文本蕴涵是计算语言学领域最具挑战性的课题之一,也是众多自然语言处理应用的一个重要部分。文本蕴涵作为一种文本推理的通用框架,为整合各种文本的语义表示方法、知识获取方法和推理方法提供了平台,具有广泛的应用前景。 本文研究了文...
- 任函
- 关键词:CO-TRAINING问答系统
- 文献传递网络资源链接
- 基于知识话题模型的文本蕴涵识别被引量:4
- 2015年
- 该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若即若文本T蕴涵假设H,说明T和H具有相似的话题分布,反之说明T和H不具有相似的话题分布。基于此,我们将T和H的蕴涵识别问题转化为相关话题的生成过程,同时将文本推理知识融入到抽样过程,由此建立一个面向文本蕴涵识别的话题模型。实验结果表明基于知识话题模型在一定程度上改进了文本蕴涵识别系统的性能。
- 任函盛雅琦冯文贺刘茂福
- 面向语言智能教学系统的领域知识图谱构建被引量:1
- 2020年
- 智能教学系统面临的突出问题之一是知识库有限且难以扩充,知识图谱则能够为智能教学系统提供丰富的知识来源和利用手段。文章提出一种面向语言智能教学系统的领域知识图谱构建方法,该方法通过建立汉语教学本体知识库以获取核心知识图谱,并利用实体及实体关系联合识别迭代模型以扩充知识图谱。该方法将有助于领域知识的自动获取和分析,一定程度上解决现有智能教学系统中知识缺乏的问题,从而改进智能教学系统的性能。
- 孙为任函
- 关键词:智能教学系统知识图谱关系抽取
- 基于词语属性的计算机辅助获取流行词语研究被引量:8
- 2006年
- 本文以2005年的1月1日至6月25日新浪网上下载的各类页面上的文本内容为研究资源集合,从中提取出有效词语,对词语的流行程度的判定属性做了定性定量的分析研究,对词语的流行特性进行了定义,在此基础上,引入衡量关注程度的量化方法,并配合依据词语判定属性与时间关系而绘制的走势曲线图,设置淘汰机制与评分机制,得到了候选流行词语,验证了流行词语判定属性规范的合理性,为机器辅助判定词语特性提供了参考数据。
- 何婷婷朱薏张勇任函
- 关键词:计算机应用中文信息处理流行词语
- 面向汉语文本推理的语言现象标注规范研究被引量:2
- 2017年
- 面向汉语文本推理的语言现象标注规范的方案包含两个阶段:第一,语言推理基本单元对分析,即确定两个文本片断中存在推理关系的文本对;第二,语言现象类别确定,即为语言推理基本单元对指派合适的类别。为此制定了一个包含20个类别的语言现象类别体系,探讨了语言推理基本单元对及其语言现象的判定原则和方法,说明了标注的实施流程、标注结果以及标注评估方案。
- 任函
- 关键词:语言现象语义单元
- 一种面向汉语国际教育的智能导学方法
- 本发明公开了一种面向汉语国际教育的智能导学方法,该面向汉语国际教育的智能导学方法具体步骤如下:S1:领域知识图谱构建,1)构建过程,2)语料收集,3)基于自举的实体及实体关系联合识别;S2:文本推理模型,1)关系向量计算...
- 任亚峰任函姬东鸿吕晨
- 文献传递
- 基于知识话题模型的文本蕴涵识别
- 分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法.其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话题;若T→H,说明T和H具有相似的话题分布,反之说明T和H不...
- 任函盛雅琦冯文贺刘茂福
- 关键词:识别方法
- 基于语言现象的文本蕴涵识别被引量:4
- 2017年
- 该文提出一种基于语言现象的文本蕴涵识别方法,该方法建立了一个语言现象识别和整体推理判断的联合分类模型,目的是对两个高度相关的任务进行统一学习,避免管道模型的错误传播问题并提升系统精度。针对语言现象识别,设计了22个专用特征和20个通用特征;为提高随机森林的泛化能力,提出一种基于特征选择的随机森林生成算法。实验结果表明,基于随机森林的联合分类模型能够有效识别语言现象和总体蕴涵关系。
- 任函冯文贺刘茂福万菁
- 关键词:语言现象