许欢庆
- 作品数:13 被引量:165H指数:6
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技型中小企业技术创新基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 基于字频的单模式匹配算法被引量:6
- 2002年
- 通过模仿人类查找字符串的过程,本文提出了一种新的单模式匹配算法(MBF算法).该算法利用QS算法的思想和已经成功匹配的前、后缀信息对模式进行预处理.在查找阶段,MBF算法利用了字符使用频率和连续跳跃的查找思想.实验表明,MBF算法比同类的其它算法更加高效.
- 刘功申王永成许欢庆
- 关键词:单模式匹配算法字符串
- 基于概念联想网络的网页预取模型被引量:1
- 2004年
- 提出一种基于概念联想网络的网页预取模型,挖掘用户访问模式中蕴含的概念间联想模式,结合在线学习和离线挖掘两种方式,建立面向用户的概念联想网络,并基于概念联想网络实现网页预取评价.模型对网页进行概念层次的分析,提高了预取的准确性,实现了基于语义的客户端网页预取.
- 孙强李建华李生红许欢庆
- 关键词:网页预取
- 基于加权概念网络的用户兴趣建模
- 用户兴趣建模是互联网个性化信息服务的关键技术。本文中,提出一种基于加权概念网络的用户兴趣建模方法。该方法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系,建立加权概念网络的用户模型,从而捕捉和表述用户兴趣偏好...
- 许欢庆王永成孙强
- 关键词:用户建模概念映射
- 文献传递
- 基于隐马尔可夫模型的Web网页预取被引量:8
- 2003年
- 为了缓解网页访问延时的问题 ,提出了一种基于隐马尔可夫模型的网页预取方法 .该方法借助隐马尔可夫模型 ,挖掘蕴涵在用户访问路径中的信息需求概念 ,以此进行预取页面的评价 ,最终实现基于语义的网页预取 .实验结果表明 。
- 许欢庆王永成孙强
- 关键词:网页预取隐马尔可夫模型
- 基于加权概念网络的用户兴趣建模被引量:24
- 2004年
- 提出了一种基于加权概念网络(WCN)的用户兴趣建模方法,该方法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系,建立WCN的用户模型,从而捕捉和表述用户兴趣偏好.基于WCN用户兴趣模型,提出了检索提问个性化理解以及文档个性化重评价的实现方法.为了检验提出方法的建模性能,设计了信息过滤仿真试验.测试结果表明,WCN有较好的用户建模性能.
- 许欢庆王永成
- 关键词:用户建模概念映射
- 中文元搜索引擎调研报告
- 2003年
- 为了帮助人们对中文搜索引擎的利用,本文在对中文搜索引擎详加调研的基础上,提出了一个调研报告,报告中分门别类地详细介绍了中文搜索引擎的现状,这也可当做一种现有中文搜索引擎的索引,供关心中文搜索引擎者参考。
- 龙宇巍王永成许欢庆
- 关键词:元搜索引擎中文搜索引擎索引
- 基于用户访问路径分析的网页预取模型
- 本文提出一种基于用户访问路径分析的服务器端网页预取模型.模型引入了隐马尔可夫模型,对用户访问序列进行语义分析,提取路径中蕴含的信息需求,依此进行网页预取决策.实验表明,模型具有较好的整体性能.
- 许欢庆王永成孙强
- 关键词:网页预取隐马尔可夫模型
- 文献传递
- 定题搜索引擎Robot的设计与算法被引量:27
- 2004年
- 定题搜索引擎将信息检索限定在特定主题领域 ,提供特定主题的信息检索服务 ,是新一代搜索引擎的发展方向之一。该文介绍了一个定题搜索robot系统NetBat2 .0 2版 ,它可以实现在web上爬行下载主题相关网页。定题搜索的关键技术是主题相关信息的搜索及网页相关度分析。该文分析了传统定题搜索算法的优缺点 ,提出了基于反向链接结合超链文本分析的定题搜索算法。文章还对基于内容的网页相关度分析算法进行了详细的论述。对比搜索实验表明系统有着较好的性能 。
- 龙宇巍王永成许欢庆
- 关键词:搜索引擎ROBOT信息检索
- 基于用户访问路径分析的网页预取模型被引量:51
- 2003年
- 随着网络信息的飞速增长,互联网已成为人们获取信息的重要来源.但是,受限于网络带宽,用户往往需要忍受较长的访问延时.为了缓解这种情况,人们提出了网页预取技术,用于降低用户的访问延迟,提高Web服务器的服务质量.提出一种基于用户访问路径分析的服务器端网页预取模型.模型通过对用户访问序列进行语义分析,提取路径中蕴含的信息需求,依此进行网页预取决策.为了实现用户访问序列中潜在意图的挖掘,模型还引入了隐马尔可夫模型.性能测试实验的结果表明,该模型具有较好的整体性能.
- 许欢庆王永成
- 关键词:网页预取隐马尔可夫模型
- 搜索引擎中Robot搜索算法的优化被引量:39
- 2002年
- 目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 。
- 宋聚平王永成滕伟许欢庆
- 关键词:搜索引擎超链接ROBOTPAGERANK搜索策略搜索算法