国家社会科学基金(07CYY022)
- 作品数:15 被引量:86H指数:6
- 相关作者:由丽萍李茹王瑞波李济洪李国臣更多>>
- 相关机构:山西大学山西财经大学晋城职业技术学院更多>>
- 发文基金:国家社会科学基金国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学语言文字更多>>
- 基于规则的中文阅读理解问题回答技术研究被引量:1
- 2009年
- 该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%,且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。
- 李济洪杨杏丽王瑞波张娜李国臣
- 关键词:计算机应用中文信息处理问答系统正交表
- 面向数据分析的中文问句句法研究
- 2009年
- 本文以面向数据分析为基本思想,同时结合相似度概率评估技术,实现中文问句句法分析。对于输入问句,首先需要经过词汇层与词性层以及句型和疑问词初选得到片段;然后,基于已构建的数据库,对词汇词性序列的子序列搜索片段,进行片段组合;最后,对输入语句与初选结果进行相似性评估,完成输入语句的组合分析过程。为论证方法有效性,基于200句山西旅游问句做实验。实验结果表明,句法分析的准确率达到96%。
- 郭海旭吕国英李茹
- 关键词:句法分析
- 基于微博的虚拟咨询模式构建
- 2014年
- 文中分析了基于微博的虚拟咨询服务模式的优势及可行性,提出了基于微博的虚拟咨询服务内容及服务形式,并在运作机制管理、信用评价体系和知识产权归属研究的基础上构建了基于微博的虚拟咨询服务模式。
- 刘爱琴尚珊史海嫣
- 基于汉语框架网的旅游信息问答系统设计被引量:14
- 2009年
- 该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结合的方式为查询问句分类,然后提出基于CFN的问句分析策略,通过CFN语义分析得到问句中三元组:语义谓词、语义主体和语义客体,在问句分析的基础上从旅游本体知识库中对答案进行抽取并对答案处理,同时用本体编辑工具Protégé编码,实验证实方法是有效的。
- 李茹王文晶梁吉业宋小香刘海静由丽萍
- 关键词:计算机应用中文信息处理本体问答系统
- 中文核心框架元素标注规则的获取和实验——以认知语义领域为例
- 2011年
- 计算机语义分析是当前制约中文信息检索、信息抽取与机器翻译等应用技术发展的瓶颈问题,而语义角色标注是语义分析的一个主要任务。即以框架语义理论为基础,以汉语框架语义知识库的核心框架元素为语义角色标注的范畴知识体系,以认知语义领域为研究实例,以真实语料为依据,根据短语类型、句法功能以及短语内、外部其他句法语义特征,获取中文语义角色标注规则,并通过实验检验规则的使用效果,为计算机自动语义分析探索一条可行的技术路线。
- 张惠春由丽萍
- 关键词:中文信息处理
- 基于汉语框架网的中文问题分类被引量:10
- 2009年
- 问题分类是问答系统中重要的组成部分,问题分类结果的准确性直接影响到问答系统的质量。基于汉语框架网(Chinese FrameNet,CFN)提出了一种用于中文问题分类的新方法。该方法通过构建一系列汉语框架语义特征来表达每个问句的语义信息,进而使用最大熵模型进行中文问题的自动分类,与传统的问题分类技术相比,汉语框架语义信息的加入使得中文问题分类的精度得到了显著提高。实验结果进一步验证了该方法的有效性,大类和小类的分类精度分别达到了91.38%和83.20%。
- 李茹宋小香王文晶
- 关键词:最大熵模型
- 基于汉语框架网的旅游信息问答系统设计
- 本文借助汉语框架网(Chinese FrameNet,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TR...
- 李茹王文晶梁吉业宋小香刘海静由丽萍
- 关键词:本体问答系统
- 文献传递
- 汉语框架语义角色的自动标注研究进展
- 在给定句子中目标词及其所属框架的前提下,本文以词为标注单位,将语义角色标注形式化为词序列标注问题,分别使用条件随机场和最大熵模型,基于山西大学的CFN语料库,研究汉语框架语义角色的自动标注。本文选取词、词性、位置以及它们...
- 李济洪王瑞波王蔚林杨杏丽高亚慧李国臣谷波
- 关键词:语义角色标注正交表
- 文献传递
- 汉语框架语义网构建及其应用技术研究被引量:23
- 2011年
- 汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的框架语义网工程,然后具体分析了汉语框架语义网的构建技术,并对基于汉语框架网的语义角色自动标注研究进行了介绍,25个框架的交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%,61.62%;最后,介绍了几个基于汉语框架语义网的研究课题的进展情况。
- 刘开瑛
- 关键词:语义角色标注
- 基于最大熵模型的中文阅读理解问题回答技术研究被引量:7
- 2008年
- 该文基于山西大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构建了词层面以及句法层面共计35个特征,基于最大熵模型对中文阅读理解问题回答进行了建模,在35个特征全部加入最大熵模型的情况下,测试集上得到了75.46%的HumSent准确率。考虑到特征取值之间的相关性对权重估计的影响,笔者先对35个特征观测值矩阵进行主成分降维,选择适当的主成分个数重构特征,然后再使用最大熵模型进行建模,在测试集上的HumSent准确率达到80.18%.实验结果表明,在阅读理解问答系统中,采用特征的主成分降维方法,能有效融合全部特征信息,回避了最大熵模型中特征筛选的过程,并且提高了阅读理解系统的准确率。
- 李济洪王瑞波王凯华李国臣
- 关键词:计算机应用中文信息处理问答系统最大熵模型主成分