广西教育厅科研项目(0991254)
- 作品数:3 被引量:4H指数:2
- 相关作者:麦范金李东普史慧甘国庆更多>>
- 相关机构:桂林理工大学更多>>
- 发文基金:广西教育厅科研项目广西研究生教育创新计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于语义理解的中文智能检索模型研究被引量:2
- 2010年
- 针对传统关键词匹配检索存在的缺陷,论文深刻剖析了语言信息量化机制及词间的语义关系,采用语义空间转换成可以量化的信息量空间,设计了一种基于语义理解的中文智能信息检索模型,从语言量化机制及语境双层次上阐述了模型的设计思想。在分析提取用户检索语义机制的基础上,提出一种计算用户查询语句语义与文档语义及语境相关度的新方法。实验表明这种检索方法可以提高搜索引擎的查全率和查准率。
- 李东普麦范金史慧
- 关键词:语义理解语义空间语境
- 基于指代消解的自动文摘方法研究
- 2010年
- 本文介绍了一种建立在指代消解基础上的自动文摘方法。创新之处是在对文档内容使用自然语言处理技术全面分析的基础之上,只需对关键句进行指代消解,缩小了消解的范围,降低了对指代消解的要求。同时模拟人性思维,对于出现在不同位置的关键词和句子赋予不同的权重,凸显出含有关键词和总结性的句子。实验证明这种方法是可行的,有效的。
- 麦范金李东普甘国庆
- 关键词:指代消解自动文摘自然语言处理
- 基于虚词停顿的中文分词消歧研究被引量:2
- 2010年
- 提出一种基于虚词停顿的中文分词消岐的模型。首先利用建立的虚词知识库对文本进行粗分词-划分停顿,然后对句子中停顿间的短语用双向最大匹配再进行分词,提取歧义部分,最后使用N-Gram模型和数据平滑等技术处理。整个过程分为粗分词、精分词和歧义消除三个过程。测试结果显示,该模型能有效地降低词歧义引起的错误切分率。
- 麦范金李东普
- 关键词:分词停顿N-GRAM模型数据平滑