吕德新 作品数:9 被引量:64 H指数:4 供职机构: 沈阳航空工业学院 更多>> 发文基金: 中国航空科学基金 辽宁省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于SVM的疑问句问点语义角色标注 被引量:5 2006年 SVM(SupportVectorM ach ine)是一种基于结构风险最小化原则的分类算法,由于其完善的理论基础使其在小样本模式识别中表现出比其他算法更好的泛化能力。语义角色标注是一种浅层语义分析的方法。为了加深对问句的理解,对问句的问点进行语义角色标注是必要的。故将问点的语义角色标注视为分类问题,并提出了一种基于SVM的问点语义角色标注方法。在哈工大标准问句集上进行实验,取得了语义角色标注封闭测试91.4%,开放测试71.6%的正确率。实验结果表明本文所采用的方法是有效的。 吕德新 张桂平 蔡东风 朱江涛关键词:SVM 语义角色标注 结构风险最小化 基于语义相似度的句法歧义结构消解 被引量:1 2006年 以汉语句法结构分析中最普遍存在的句法结构歧义现象,即“动词短语+名词短语+的+名词短语”(VP+NP1+的/u+NP2)为研究对象,提出了一种基于知网知识库的歧义消解策略。据此提出利用改进的知网相似度计算的歧义消解策略。通过对从人民日报的语料中抽取1000个“VP+NP1+的/u+NP2”的实例进行测试,实验结果正确率达到83.4%,表明这是一种有效的识别“VP+NP1+的/u+NP2”歧义结构的方法。 周俏丽 蔡东风 吕德新 朱江涛 吴英泽关键词:知网 歧义结构 消歧 相似度计算 基于启发式信息的中文姓名识别方法 被引量:1 2006年 提出了一种以姓氏和互信息作为启发式信息探测潜在姓名,对上下文进行局部全切分,最后利用隐马尔科夫模型为工具识别姓名的新方法。本方法将姓名识别,汉语分词,词性标注结合为一体,总体上提高了姓名识别的性能,一定程度上解决了分词错误对姓名识别带来的影响。实验结果表明本文提出的方法是有效的。 朱江涛 蔡东风 吕德新 周俏丽关键词:姓名识别 自动分词 词性标注 全切分 基于语义信息的问题分类 被引量:4 2006年 问题分类是问答系统的一个非常基础而重要的子模块。以问题的语义信息为分类依据,建立了一个新的问题分类体系,并提出了一种基于《知网》的自动分类方法。利用该方法对507个问题进行分类实验。实验中问题分类的平均召回率为93.72%,平均正确率为82.23%。实验结果表明,该分类方法是有效的并且以语义信息作为分类依据是可行的。 吕德新 张桂平 蔡东风 余超关键词:知网 问答系统 致使动词对“动+名1+的+名2”歧义结构的影响 被引量:2 2006年 配价理论对汉语的句法结构组合具有一定的解释力,它可以从语法的角度来进行优选,消除句法结构歧义。带有致使意义的动词会对动词的配价数和句型归类产生影响,所以本文提出当“动+名1+的+名2”中的“动”为致使动词时,我们可以通过动词的配价数和句型归类实现对“动+名1+的+名2”歧义结构的消解。实验结果表明本文提出的方法是有效的。 周俏丽 蔡东风 吕德新 朱江涛 吴英泽关键词:结构歧义 消歧 致使动词 中文自动问答系统中问题理解技术的研究 问答系统(Question Answering System,QA)是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是... 吕德新关键词:问答系统 最大熵 语义角色标注 知网 互信息 文献传递 基于知网的中文问题自动分类 问答系统能用准确、简洁的答案同答用户用自然语言提出的问题.问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行.本文提出了一种使用知网作为语义资源选择分类特征,并使用最大熵模型进行分类的新方法.以问... 孙景广 蔡东风 吕德新 董燕举关键词:问答系统 知网 最大熵模型 中文问题 文献传递 基于知网的中文问题自动分类 被引量:49 2007年 问答系统应能用准确、简洁的答案回答用户用自然语言提出的问题。问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行。本文提出了一种使用知网作为语义资源选取分类特征,并使用最大熵模型进行分类的新方法。该方法以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征。实验结果表明,在知网中选取的首义原能很好的表达问题焦点词的语义信息,可作为问题分类的一个主要特征。该方法能显著地提高问题分类的精度,大类和小类的分类精度分别达到了92.18%和83.86%。 孙景广 蔡东风 吕德新 董燕举关键词:计算机应用 中文信息处理 问答系统 知网 最大熵模型 基于知网的中文问题自动分类 问答系统能用准确、简洁的答案回答用户用自然语言提出的问题。问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行。本文提出了一种使用知网作为语义资源选择分类特征,并使用最大熵模型进行分类的新方法。以问... 孙景广 蔡东风 吕德新 董燕举关键词:问答系统 知网 最大熵模型 文献传递