您的位置: 专家智库 > >

河北省科技支撑计划项目(12213516D)

作品数:2 被引量:10H指数:2
相关作者:高凯阳春辉杨军伟马红霞王九硕更多>>
相关机构:河北科技大学石家庄职工大学更多>>
发文基金:河北省科技支撑计划项目河北省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息采集
  • 1篇引擎
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇爬虫
  • 1篇聚类
  • 1篇分词
  • 1篇NUTCH
  • 1篇LUCENE
  • 1篇垂直搜索
  • 1篇垂直搜索引擎

机构

  • 2篇河北科技大学
  • 1篇石家庄职工大...

作者

  • 2篇高凯
  • 1篇周二亮
  • 1篇陶秋红
  • 1篇王九硕
  • 1篇马红霞
  • 1篇杨军伟
  • 1篇阳春辉

传媒

  • 1篇河北工业科技
  • 1篇小型微型计算...

年份

  • 1篇2013
  • 1篇2012
2 条 记 录,以下是 1-2
排序方式:
基于Carrot2聚类的垂直搜索引擎的研究与实现被引量:5
2012年
给出了一个基于Nutch的垂直搜索引擎系统的实现,主要探讨了基于Lucene和Carrot2的信息检索与聚类的实现,并对分词、垂直信息采集等的实现进行了说明。
高凯阳春辉陶秋红张洋杨军伟
关键词:搜索引擎LUCENENUTCH分词聚类
微博信息采集及群体行为分析被引量:5
2013年
随着在线社会关系网络的迅猛发展,每天数以千万计的人通过发表、评论、分享等方式,产生和传播各类话题.对在线社会关系数据的感知与收集、存储管理、群体行为等进行研究,能更好地挖掘和分析社会关系网络.由于微博平台的登录、数据显示与处理等方面与传统网络平台有很大差异,传统网络爬虫不适于对微博信息的全面抓取.本文采用模拟用户浏览行为方法来爬取海量微博数据,通过数据包截取与分析等手段获取相关信息.实验结果表明该方法的有效性.在此基础上,以收集的微博数据为研究对象,对群体行为进行了分析.
高凯王九硕马红霞周二亮Radha Ganesan
关键词:信息采集
共1页<1>
聚类工具0