陈亚东
- 作品数:5 被引量:11H指数:2
- 供职机构:苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室更多>>
- 发文基金:国家自然科学基金江苏省高校自然科学研究项目国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于跨场景推理的事件关系检测方法被引量:1
- 2014年
- 事件关系检测是一项面向事件之间逻辑关系的自然语言处理技术。事件关系识别的核心任务是以事件为基本语义单元,通过分析事件的篇章结构信息及语义特征,实现事件逻辑关系的深层检测。该文首次建立一套事件关系检测的任务和研究体系,包括任务定义、关系体系划分、语料采集与标注、评价方法等。同时,该文提出了一种跨场景推理的事件关系检测方法,该方法认为,具有相同事件场景的"事件对",往往具有相同的事件关系类型。该文提出的基于跨场景推理的事件关系检测方法在针对四大类事件关系类型的检测精确率为54.21%。
- 杨雪蓉洪宇陈亚东王潇斌姚建民朱巧明
- 关键词:框架语义
- 面向框架语义分析的目标词自动识别方法被引量:2
- 2015年
- 提出了一种基于监督学习的目标词自动识别方法,分析并检验了多种区分目标词、框架元素和非实义词的分类特征,并在此基础上,联合使用监督学习与规则匹配方法,形成了兼顾扩展性和精确性的目标词识别系统。在Frame Net语料集的实验结果显示,融合方法的目标词识别获得了3.86%的性能提升。
- 陈亚东洪宇杨雪蓉王潇斌姚建民朱巧明
- 关键词:框架语义
- 利用框架语义知识优化事件抽取被引量:4
- 2017年
- 事件抽取旨在把含有事件信息的非结构化文本以结构化的形式予以呈现。现有的基于监督学习的事件抽取方法往往受限于数据稀疏和分布不平衡问题,具有较低的召回率。针对这一问题,该文提出一种利用框架语义优化事件抽取的方法,引入框架类型作为泛化特征,在此基础上进行框架类型和事件类型的映射,然后结合框架类型识别模型和事件类型识别模型进行协作判定,以此优化事件抽取的召回性能。实验结果显示,针对触发词(事件类型)识别任务,相较于仅使用事件类型识别模型,该文提出的框架语义辅助的事件类型识别模型能够提高抽取召回率6.44%(5.74%),提高F值1.45%(0.83%)。
- 陈亚东洪宇王潇斌杨雪蓉姚建民朱巧明
- 关键词:事件抽取信息抽取框架语义
- 事件关系检测的任务体系概述被引量:2
- 2015年
- 事件关系检测是一项面向文本信息流进行事件关系判定的自然语言处理技术。事件关系检测的核心任务是以事件为基本语义单元,通过分析事件之间的语义关联特征,实现事件逻辑关系的识别与判定,包括关系识别(即识别有无逻辑关系)和关系判定(即判定逻辑关系类型,如"因果"关系)。目前,专门面向事件的逻辑关系分析与处理,尚未形成一套完整的研究体系。针对这一问题,该文借助篇章分析、事件抽取和场景理解等相关领域中的概念与数据资源,尝试建立一套事件关系检测的任务和研究体系,包括任务定义、关系体系划分、语料采集与标注、评价方法等。同时,该文着重分析和对比了事件关系检测与篇章关系检测的差异,并给出了事件关系检测任务的难点与挑战。
- 杨雪蓉洪宇陈亚东姚建民朱巧明
- 关键词:篇章分析论元语义关系
- 融合多模型与高置信度词典的事件线索检测被引量:2
- 2017年
- 提出一种融合多模型和高置信度词典的事件线索识别方法,将高置信度词典特征分别加入最大熵模型和条件随机场模型,然后融合两个模型的结果,旨在提高触发词识别的召回率和整体性能。针对事件真伪性识别任务,进一步考察否定词或不确定词与触发词的物理位置距离和依存路径距离等特征,提高事件真伪性识别的性能。实验结果显示,针对触发词识别和事件真伪性识别任务,与仅使用最大熵模型相比,所提出的融合多模型与高置信度词典的方法能够提高触发词识别的性能6.43%,提高事件真伪性识别的性能1.69%。
- 陈亚东洪宇王潇斌杨雪蓉姚建民朱巧明
- 关键词:最大熵模型