张菲菲
- 作品数:2 被引量:17H指数:2
- 供职机构:西安邮电大学计算机学院更多>>
- 发文基金:陕西省教育厅科研计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于异构知识库的命名实体消歧被引量:9
- 2014年
- 针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。
- 宁博张菲菲
- 关键词:人名消歧维基百科层次聚类
- 基于层次聚类的跨文本中文人名消歧研究被引量:8
- 2014年
- 人名消歧已经成为自然语言处理和信息抽取应用中亟待解决的重要问题。运用中文自然语言处理和信息抽取系统识别命名实体和实体关系,生成实体信息对象(Entity Profile),采用实体信息对象(EP)中的个人信息特征,实体关系和上下文相关信息在Hadoop平台上基于凝聚的层次聚类方法解决了实体消歧问题。采用哈尔滨工业大学整理的全网新闻语料作为人名消歧训练和测试数据,着重研究了中文人名消歧特征的选取,参数的确定和验证,在训练集和测试集上分别取得了91.33%和88.73%的F值。说明提出的方法具有较好的可行性。
- 张菲菲李宗海周晓辉李晓戈
- 关键词:人名消歧信息抽取相似度层次聚类