辽宁省自然科学基金(20042004)
- 作品数:2 被引量:50H指数:2
- 相关作者:蔡东风吕德新董燕举孙景广姚天顺更多>>
- 相关机构:沈阳航空工业学院东北大学更多>>
- 发文基金:中国航空科学基金辽宁省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于知网的中文问题自动分类被引量:49
- 2007年
- 问答系统应能用准确、简洁的答案回答用户用自然语言提出的问题。问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行。本文提出了一种使用知网作为语义资源选取分类特征,并使用最大熵模型进行分类的新方法。该方法以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征。实验结果表明,在知网中选取的首义原能很好的表达问题焦点词的语义信息,可作为问题分类的一个主要特征。该方法能显著地提高问题分类的精度,大类和小类的分类精度分别达到了92.18%和83.86%。
- 孙景广蔡东风吕德新董燕举
- 关键词:计算机应用中文信息处理问答系统知网最大熵模型
- 双语知识库中关联实例的多策略提取机制被引量:2
- 2007年
- 双语库是翻译记忆系统最重要的组成部分之一。从有限规模的双语库中提取更多的符合用户当前翻译需要的关联实例是翻译记忆技术研究的主要内容,本文首先对当前基于单一方法的实例检索算法存在的局限性进行了分析,并在对双语库进行知识化表示的基础上,提出了基于多策略的关联实例提取机制,即综合运用句子句法结构匹配、句子编辑距离计算、句子短语片段匹配、词汇语义泛化、基于扩展信息(如:句子来源、所属专业、应用频度等信息)的优选等策略进行关联实例提取。试验结果表明,该方法有效提高了关联实例的召回数量和质量,明显改善了对用户的辅助效果。
- 张桂平姚天顺尹宝生蔡东风宋彦
- 关键词:人工智能机器翻译翻译记忆