汪建海
- 作品数:3 被引量:8H指数:1
- 供职机构:厦门大学信息科学与技术学院自动化系更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 运用UML分析ERP系统
- 统一模型语言UML是运用最广泛的可视化面向对象系统的建模方法.如何运用UML尽可能快速、有效地开发和部署应用系统有着其内在复杂性.介绍了如何运用UML和Rational Rose强大的可视化建模工具来协助开发ERP系统,...
- 汪建海罗键
- 关键词:企业资源规划统一建模语言面向对象
- 文献传递
- 基于重复检测的多摘要消重方法被引量:1
- 2006年
- 针对目前Web信息挖掘中存在大量页面重复的问题,从Web信息的组织角度对其中的一些关键问题进行深入分析,提出了基于关键词的部分相似页面消重算法——Web多摘要消重方法(multiabstractremoverepeat,MARR)。MARR方法对传统基于词表和倒排文件的Web信息数据库进行改装,增加一个字段用于记录关键词所对应的摘要块号,采用文本摘要算法,按倒排文件方式索引,根据内容基于查询词目的相似程度,在检索过程中过滤或标识与查询词目相关的部分内部重复现象,以获得更合理的检索结果组织形式。MARR方法还将传统按PageRank值顺序排列改成树型组织方式,以方便用户信息发现的需要。该方法在基于三明钢铁集团MES智能信息代理的原型化Web检索系统中得到应用。
- 程菲汪建海罗键
- 关键词:信息检索文本摘要倒排文件
- 增量更新Crawler进行Web收集方法研究被引量:7
- 2006年
- 本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行演化更新,可以在减少网络流量的同时获得接近现有网络爬虫系统的效果。
- 程菲汪建海罗键
- 关键词:信息检索网络爬虫