北京市自然科学基金(4062013)
- 作品数:6 被引量:37H指数:4
- 相关作者:康丽罗长寿刘国靖张峻峰于峰更多>>
- 相关机构:中国农业大学北京市农林科学院农业科技信息研究所更多>>
- 发文基金:北京市自然科学基金北京市科技新星计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于遗传算法的主题爬虫策略被引量:18
- 2007年
- 针对目前主题搜索策略的不足,通过改进遗传算子提出了一种新的主题爬虫策略,即通过变异操作引入新的URL扩大搜索范围;通过交叉操作产生大量的URL;通过选择操作选出适应度高的个体作为下一代的种子。实验结果表明,基于遗传算法的主体搜索策略GA与BFS和OPS相比,爬虫策略取网页中的主体相关网页数量多,在合理选择种子集合时,能抓取大量的主体相关度高的网页。
- 刘国靖康丽罗长寿
- 关键词:主题爬虫遗传算法主题相关度搜索引擎
- 基于遗传算法的主题信息搜索系统研究被引量:1
- 2009年
- 针对网络信息资源"迷向"与"过载"的现象,本文通过对遗传算法的分析应用,构建了由基于遗传算法的主题爬虫、信息处理和查询服务三部分组成的主题信息搜索系统。实验结果表明,应用该系统可以获取与主题相关度高的网页信息。
- 罗长寿康丽刘国靖
- 关键词:主题遗传算法爬虫搜索系统
- 基于叙词表的主题爬虫技术研究被引量:8
- 2007年
- 将叙词表同传统的信息检索技术相结合,提出用叙词表的族对爬虫的主题进行描述的方法并用该方法设计实现一主题爬虫。实验结果证明本文提出模型和算法的有效性。
- 夏崇镨康丽
- 关键词:主题爬虫叙词表搜索引擎
- 基于Ontology的Web信息检索方法被引量:5
- 2007年
- 分析了传统检索技术中存在的问题,即基于关键字的检索忽视了关键字本身所包含的语义信息,导致较低的查全率和查准率。将Ontology应用于信息检索系统改善这种状况,提出了基于Ontology的Web信息检索模型,给出了基于此模型的Web信息检索流程。
- 程新荣杨仁刚康丽
- 关键词:本体信息检索WEB
- 基于Agent的农业个性化搜索技术研究
- Web上信息的不断增长对搜索引擎提出了更高的要求,个性化搜索引擎成为目前研究的一个热点。本文介绍了个性化搜索引擎的关键技术、Agent技术并指出了Agent技术用于个性化搜索的优势,然后设计了一个基于Agent的农业个性...
- 蒋国武程新荣罗长寿
- 关键词:个性化搜索引擎AGENT
- 文献传递
- 农业信息资源整合系统研究与应用被引量:4
- 2007年
- 应用中间件、元搜索及网络爬虫等技术与思想构建农业信息资源整合系统,以期对已有的农业信息资源进行整合,从而为用户提供方便服务。
- 孙素芬罗长寿张峻峰于峰张树亮
- 关键词:农业信息资源中间件元搜索爬虫
- 基于遗传算法的主题信息获取系统研究
- 针对网络信息资源'迷向'与'过载'的现象,通过对遗传算法的分析与应用,建立了基于遗传算法的主题信息获取系统。实验结果表明,应用该系统可以获取大量与主题相关度高的网页信息,可以提高网页主题信息获取的准确率。
- 罗长寿程新荣刘国靖
- 关键词:主题遗传算法爬虫
- 文献传递
- 基于查准率的网页信息搜索技术研究分析被引量:2
- 2007年
- 随着网络的发展,如何提高网页信息搜索的查准率成为研究的热点。通过对基于标记的网页信息搜索技术、基于元搜索的网页信息搜索技术、以及基于爬虫的网页信息搜索技术在查准率方面的研究进行了分析,并对其未来发展趋势进行了讨论。
- 罗长寿孙素芬张峻峰于峰刘月仙
- 关键词:查准率元搜索爬虫