洪辉 作品数:7 被引量:33 H指数:4 供职机构: 武汉大学计算机学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 湖北省自然科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 经济管理 更多>>
基于覆盖关系的Deep Web数据源排名 被引量:5 2007年 Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检索的结果是抽样结果.通过选择合适的抽样方法,使抽样所反映出来的部分数据覆盖关系能够从一定程度上反映整个Deep Web的数据覆盖关系.进而通过对覆盖关系的估计,确定覆盖程度,并按其进行排名. 余伟 李石君 洪辉 田建伟关键词:DEEP WEB 抽样方法 基于语义的中文深网查询接口集成 洪辉关键词:语义 深网 接口集成 词语相似度 基于语义的中文Deep Web查询接口集成 被引量:14 2008年 现在网上信息正越来越被在线数据库深化,而传统的搜索引擎对此类信息源却没有很好的获取办法,加剧了人们想得到有用知识而搜索结果并不理想的形势。本文针对这种情况,简要论述了中文Deep Web研究工作的必要性及其发展前景,探讨了中文Deep Web技术的关键问题,并基于中文语义,提出了中文Deep Web中的查询接口集成方案。实验表明该方法能使得接口之间属性匹配的正确率达到98%以上。 洪辉 李石君 余伟 田建伟关键词:深网 接口集成 基于信任指数的对抗web垃圾页面方案研究 2006年 本文首先提出链接分析法中存在的垃圾页面问题并将其形式化描述出来;再从两个角度分别介绍了挑选种子页面集的思想;然后在改进现有PageRank算法的基础上提出了垃圾页面检测算法;同时给出了几个表征检测算法效率的性能指标,最后简要阐述了基于信任指数的对抗web垃圾页面方案。 洪辉 李石君 张科 欧伟杰关键词:搜索引擎 智能WEB信息提取系统的研究和设计 被引量:10 2005年 XML业已成为WEB数据发布与交换的标准,包装器技术为数据挖掘提供了重要实现步骤,智能代理技术以其智能、代理特性在控制协调挖掘上起着重要作用。本文将这三项标准和技术进行有机结合,应用于WEB数据挖掘上,借助J2EE三层体系结构思想,给出了智能WEB信息提取实现方案,并简要阐述了该系统处理用户挖掘请求的流程,体现了该系统较强的智能理解和概括能力。 洪辉 刘子敬 李石君 欧伟杰关键词:XML 包装器 智能代理 数据挖掘 一种基于瞬索技术的搜索引擎的研究 被引量:4 2006年 随着WWW上信息爆炸式的增长,对信息的查询提出了严峻的挑战,如何快速、准确而又全面的查询到所需信息是现代查询技术研究的关键。XML作为一种可扩展标记语言,具有HTML无可比拟的优点,使新的搜索引擎的研究成为可能。而最新研发的瞬索XML数据搜索引擎很好地利用了XML的优点,它实现了低成本的超高速数据搜索。本文在瞬索技术的基础上,设计了一个新的搜索引擎体系结构,该结构充分利用了瞬索技术的优点,可实现全面、快速的查询。 洪辉 刘子敬 李石君 欧伟杰关键词:XML 搜索引擎 针对主题挖掘的通用设计与性能评估框架的研究 2006年 本文不是设计一种新的主题挖掘机,而是借助分层思想,为每层赋予特定的任务,采用容器管理机制,提出了一种针对主题挖掘的通用设计框架,该设计框架旨在规范和指导主题挖掘机的研发设计步骤;同时提供了相应的评估框架,其中包括几个重要的评估参数,根据这些参数的实验值可以估量挖掘机的性能,以此推动高效挖掘机的研发设计。 洪辉 胡海峰 李石君 杜睿 熊慧君 欧伟杰关键词:主题挖掘