王嫄
- 作品数:1 被引量:15H指数:1
- 供职机构:南开大学计算机与控制工程学院更多>>
- 发文基金:天津市自然科学基金天津市科技计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于结构相似度的大规模社交网络聚类算法被引量:15
- 2015年
- 针对社交网络的有向交互性和大规模特性,该文提出一种基于结构相似度的有向网络聚类算法(Dir SCAN),以及相应的分布式并行算法(PDir SCAN)。考虑社交网络中节点间的有向交互性,将行为结构相似的节点聚集起来,并进行节点功能分析。针对社交网络规模巨大的特点,提出Map Reduce框架下的分布式并行聚类算法,在确保聚类结果一致的前提下,提高处理性能。大量真实数据集上的实验结果表明,Dir SCAN比无向网络聚类算法(SCAN)在F1上可提高2.34%的性能,并行算法PDir SCAN比Dir SCAN运行速度提升1.67倍,能够有效处理大规模的有向网络聚类问题。
- 陈季梦陈佳俊刘杰黄亚楼王嫄冯霞
- 关键词:社交网络MAPREDUCE