施磊磊
- 作品数:12 被引量:18H指数:2
- 供职机构:江苏大学计算机科学与通信工程学院更多>>
- 发文基金:江苏省科技支撑计划项目国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 海量数据存储模型的研究
- 2014年
- 随着互联网上信息量的爆炸式增长,海量网页数据的存储出现了难题。针对海量网页数据进行存储的问题,传统的集中式存储和管理方案已经难以提供高效、可靠和稳定的服务。本文设计并实现了一种针对海量网页数据进行存储的分布式平台模型。该模型利用Hadoop集群和基于HDFS分布式文件系统的Hbase数据库实现高效率地分析、计算和存储海量数据,以MapReduce计算模型和Zookeeper同步协同系统保持数据写入的高效性和一致性。最后通过实验测试,该存储模型可以克服传统的存储模型存储时存在的读写效率低、数据写入不一致的问题,同时具有良好的扩展性、可行性、稳定性和可靠性。
- 施磊磊施化吉
- 关键词:HADOOP集群MAPREDUCEHBASE
- 改进的模糊控制算法在机器人路径规划中的应用被引量:2
- 2014年
- 针对模糊控制算法存在局部最小值问题,提出了基于行为的模糊控制算法。首先将移动机器人的运动规划行为分解为避障行为和目标趋向行为,然后通过设定相关的模糊规则,设计避障行为和目标趋向行为,从而完成路径规划,最后采用MOBOTSIM对算法进行仿真实现,验证了该算法的有效性。
- 施磊磊施化吉束长波宋玉平
- 关键词:移动机器人路径规划模糊控制算法
- 基于Hadoop的PageRank算法改进
- 2015年
- 针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。
- 施磊磊施化吉宋玉平束长波
- 关键词:HADOOP集群MAPREDUCEPAGERANK
- 在线网络社区中舆论领袖识别模型的研究
- 2015年
- 目前,有许多理论被用来识别舆论领袖,一般使用节点的度数、紧密度、介数和不同领域的Page Rank算法等中心化指标来识别出舆论领袖,这些方法虽然简单,但是由于它们仅利用了节点自身的外部属性,因而识别率并不高。为此,文章提出了一种舆论领袖识别模型IDMS。该模型不但考虑了节点的外部属性,而且还综合考虑了节点的内部属性,如文本内容的相关度。最后通过实验,验证了该模型可以更准确地识别出舆论领袖。
- 赵丹丹施磊磊
- 关键词:网络社区舆论领袖
- 基于社会网络分析的舆论领袖权威度影响研究
- 2016年
- 基于社会网络分析,研究网络用户权威度,建立一个基于发帖者、回帖者以及他们之间回复关系的在线舆论推荐网络,使用NodeXL软件计算出SNA中的5个网络中心性和一个聚类系数。通过相关分析和多元回归分析对模型进行研究。实验结果表明,6个SNA方法之间及其网络用户权威度之间有着重要的相关性,同时影响最大的是PageRank中心性。可见,网络链接结构复杂程度在网络用户权威度研究以及影响力传播过程中有着重要影响。
- 徐慧冯雪晴施磊磊杨海月
- 关键词:社会网络分析舆论领袖网络中心性
- 基于影响力扩散内容模型的舆论领袖识别方法被引量:2
- 2016年
- 以影响力为衡量标准的影响力扩散模型,广泛用于挖掘和分析社交网络舆论领袖及热门话题,但因其在计算影响力时没有考虑文本内容相似度,导致舆论领袖识别的准确率不高,为此,提出一种影响力扩散内容模型。根据帖子回复关系构建帖子之间的外部链接结构;使用向量空间模型计算帖子间的内容相似度,构建内部链接结构;根据所含高频关键词个数比赋予每个帖子相应的影响力值。该过程整合了帖子回复结构网络特性及帖子内容相似度等信息,提高了舆论领袖的识别准确率。实验结果表明,该方法比影响力扩散模型效果更好。
- 徐慧冯雪晴施磊磊朱玉婷
- 关键词:向量空间模型
- 基于度中心性局部扩展的社区划分算法被引量:2
- 2021年
- 社交网络中社区划分问题的研究不仅为网络演化、信息传播和影响力分析等方向提供了理论依据,而且在好友推荐、商业营销和舆情检测等领域有着重要应用价值。针对基于贪婪优化的社区划分算法AGSO不稳定问题,提出了一种基于度中心性局部扩展的社区划分算法(DCLE)。首先计算所有节点的度中心性(Degree Centrality),其次将链接两端节点度中心性之和作为链接的度中心性并降序排序,其后将度中心性最大链接作为初始链接加入网络,最后基于贪婪策略局部扩展并迭代,得到最终的社区划分结果。通过在公开的数据集和大型人工网络上进行实验,结果表明DCLE算法能快速且准确地发掘社区结构,稳定性得到显著提升。
- 柳曾雄施化吉李雷施磊磊孙祥瑜
- 关键词:社交网络
- 基于Hadoop的分布式主题网络爬虫的设计与实现被引量:2
- 2015年
- 随着大数据时代的来临,传统的单机式或多线程式的主题爬虫已经很难满足海量数据的爬取任务。为此,首先采用向量空间模型来提高下载网页的主题相关度,然后引入MapReduce分布式计算模型以达到高效率的分布式海量爬取,同时利用基于HDFS的HBase分布式数据库达到高效率的分布式海量存储,最后通过实验结果数据验证设计的主题爬虫模型的高效性、扩展性、可靠性和稳定性。
- 施磊磊施化吉宋玉平束长波
- 关键词:主题爬虫HADOOP集群分布式
- 社会网络中基于主题的影响力最大化算法被引量:3
- 2016年
- 为了解决现有的影响力最大化研究没有充分考虑主题对影响力节点挖掘的影响而导致特定主题下节点集合的影响范围不大这一问题,提出了一种社会网络中基于主题的影响力最大化算法TIM。该算法首先根据主题敏感阈值对初始节点集进行预处理,剔除干扰节点,再在新的节点集合上分两个阶段进行节点挖掘。第一阶段挖掘主题权威性大的节点,第二阶段挖掘主题影响增量最大的节点,最后综合两个阶段的节点作为结果集并进行实验验证。实验结果表明,相比其他算法,TIM算法挖掘的节点集合在特定主题下的影响范围更大,时间复杂度更低。
- 朱玉婷李雷施化吉周从华施磊磊徐慧
- 关键词:社会网络主题
- 基于Hadoop和HBase的Nutch网页排序算法研究被引量:1
- 2014年
- 针对Nutch网页排序算法和中文分词的不足以及单机运行的效率问题,在Nutch综合网页排序中添加用户点击率、网页发布时间以及主题内容相关度3个影响因子,同时添加JE中文分词器,最后利用基于HDFS的HBase技术使Nutch能够实时高效地索引和检索海量数据。通过对实验结果数据的分析发现,Nutch的爬取和索引效率提高了7.93%,用户检索效率与查询准确度分别提高了11.11%与19.51%。
- 施磊磊施化吉宋玉平束长波
- 关键词:HADOOP集群MAPREDUCENUTCHHBASE