蒋宇
- 作品数:4 被引量:31H指数:2
- 供职机构:西安交通大学电子与信息工程学院计算机软件与理论研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于概念的信息检索查询扩展被引量:24
- 2006年
- 文章针对信息检索中存在的查询词“表达差异”问题,提出一种基于概念的查询扩展方法。一方面将用户查询中使用的词或短语与文档中抽出的概念相连接加入原查询,同时将作为扩展词的概念进行分类查询并采用整合排序算法调整结果;另一方面引入概念图供用户手动调节来进行查询扩展,以达到查询优化的目的。试验结果表明,该方法适宜改进Web上的信息检索,相对没有扩展的查询可以大幅度提高查询精度。
- 张选平蒋宇袁明轩马琮梁平
- 关键词:信息检索查询扩展概念图
- 一种基于概念抽取的元搜索引擎
- 2006年
- 文章在概念抽取算法基础上,提出一种基于概念的元搜索引擎体系结构。这种体系结构提供统一的用户界面,通过查询适配可以同时使用多个独立搜索引擎的高级搜索功能。并且通过概念抽取对搜索结果进一步分析,使其更为准确和详细。系统提供了概念图这种独特的结果显示方式,引导用户细化搜索范围以得到更为精确的结果。
- 张选平袁明轩蒋宇马琮梁平
- 关键词:元搜索引擎概念抽取相关度排序
- 一种基于概念抽取的相关词推荐模型被引量:2
- 2006年
- 搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概念抽取的相关词推荐模型,该模型克服了传统相关词推荐模型的一些不足,提供精确度更高的相关词作为二次搜索关键词,使信息搜索达到更好的效果。
- 张选平马琮蒋宇袁明轩梁平
- 关键词:WEB搜索概念抽取相关度
- 一种基于同层网页相似性去除网页噪音的方法被引量:5
- 2006年
- 一个普通的Web页面可以被分成信息块和噪音块两部分。基于web信息检索的第1步就是过滤掉网页中的噪音块。通过网页的特性可以看出,同层网页大多具有相似的显示风格和噪音块。在VIPS算法的基础上,该文提出一种基于同层网页相似性的匹配算法,这个算法可以被用来过滤网页中的噪音块。通过实验检测,算法可以达到95%以上的准确率。
- 袁明轩张选平蒋宇赵仲孟
- 关键词:网页噪音