王凯华
- 作品数:6 被引量:7H指数:1
- 供职机构:山西大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字理学更多>>
- 基于最大熵模型的中文阅读理解问题回答技术研究被引量:7
- 2008年
- 该文基于山西大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构建了词层面以及句法层面共计35个特征,基于最大熵模型对中文阅读理解问题回答进行了建模,在35个特征全部加入最大熵模型的情况下,测试集上得到了75.46%的HumSent准确率。考虑到特征取值之间的相关性对权重估计的影响,笔者先对35个特征观测值矩阵进行主成分降维,选择适当的主成分个数重构特征,然后再使用最大熵模型进行建模,在测试集上的HumSent准确率达到80.18%.实验结果表明,在阅读理解问答系统中,采用特征的主成分降维方法,能有效融合全部特征信息,回避了最大熵模型中特征筛选的过程,并且提高了阅读理解系统的准确率。
- 李济洪王瑞波王凯华李国臣
- 关键词:计算机应用中文信息处理问答系统最大熵模型主成分
- 基于语义标注的中文阅读理解语料库
- 李济洪郝晓燕由丽萍李茹赵国荣刘开瑛李黎董佳蓉赵玉娟张娜张国华王凯华尹晓丽
- 阅读理解系统(Reading Comprehension,以下简称RC)指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统。该课题的任务是为RC的研制构建一个基于汉语框架语义知识库(Chi...
- 关键词:
- 关键词:语料库语义标注框架语义
- 基于最大熵模型的中文阅读理解技术研究
- 本文基于山西大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个特征,并使用最大熵模型对中文阅读理解问题回答进行了建模。考虑到语料库规模较小,我们以1:...
- 李济洪王凯华王瑞波
- 关键词:问答系统最大熵
- 文献传递
- 基于最大熵模型的中文阅读理解问答系统研究
- 阅读理解问答系统能够自动分析给定的一篇自然语言文章,并且根据文中的信息,为每个针对本篇文章提出的问题生成相应的答案。目前英文阅读理解问答技术的研究已有很多,但针对中文阅读理解问答技术的研究还较少。 本文首先介绍了最大熵...
- 王凯华
- 关键词:问答系统最大熵模型
- 基于最大熵模型的中文阅读理解技术研究
- 本文基于山两大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个特征,并使用最大熵模型对中文阅读理解问题回答进行了建模。考虑到语料库规模较小,以1:1的...
- 李济洪王凯华王瑞波
- 关键词:汉字处理最大熵模型数理语言学
- 文献传递
- 基于最大熵模型的中文阅读理解问答系统技术研究
- 阅读理解系统是自动分析给定的一篇自然语言文章,并且根据文中的信息为每个针对本篇文章的问题生成一个答案的系统。目前英语阅读理解问题回答的研究已有很多,但对中文阅读理解问题回答技术的研究还很少。本文基于山西大学自主开发的中文...
- 王凯华李济洪张国华王瑞波
- 关键词:最大熵MEQA
- 文献传递