贾东风
- 作品数:2 被引量:6H指数:2
- 供职机构:重庆大学更多>>
- 发文基金:重庆市高等教育教学改革研究项目中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 云计算环境下基于代表点增量层次密度聚类的微博事件检测及跟踪被引量:3
- 2013年
- 为从微博服务平台产生的大量实时信息中抽取新闻事件,提出了一套完整的云计算环境下的微博事件检测跟踪算法。首先采用新的基于微博转发数和评论数的权值计算方法,将微博文本表示成向量空间模型;再利用基于代表点的增量层次密度聚类(RIHDBSCAN)算法抽取关键词,最终实现新闻事件的检测和跟踪。针对单一节点无法快速高效地处理海量微博数据的问题,将算法部署在云计算平台Hadoop上。通过在新浪微博平台上获取的真实数据进行实验,结果表明,所提出的权值计算方法比TF-IDF和UF-ITUF有更高的性能,并且云框架的使用较好地提高了处理速度,适合用于海量数据的分析和挖掘。
- 冯永韩楠贾东风
- 关键词:密度聚类算法云计算HADOOP平台代表点
- 基于分布式MBUT-LDA的微博用户主题挖掘
- 微博作为当下最主流的社交网络平台之一,已经成为用户发布和获取实时信息的重要手段。微博主题建模能够从海量信息中挖掘用户感兴趣的话题和其他用户。但是由于微博具有消息文本短、信息更新快、以及数据量巨大等特点,传统的主题建模方法...
- 贾东风
- 关键词:时间维度HADOOP平台
- 文献传递