杜凌霞
- 作品数:3 被引量:15H指数:2
- 供职机构:中国人民大学信息学院数据工程与知识工程实验室更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 多核架构下的数据处理算法优化策略综述被引量:7
- 2011年
- 多核处理器,尤其是单芯片多处理器(chip multi-processor,CMP)能够提供强大的共享内存的并行资源,然而单核处理器上的程序和算法并不能充分利用多核架构提供的并行计算资源,因此必须针对多核体系架构特点,对算法进行改进优化,提高算法的执行性能。以优化程序局部性、减少cache访问冲突、提高线程并行度、充分利用单指令多数据流(single instruction multipledata,SIMD)并行和带宽优化等几方面为出发点,归纳和分析了多核处理器上数据处理算法的相关优化策略,并对多核算法进行了总结评述。最后阐述了该领域亟待解决的诸多问题,展望了未来的研究发展方向。
- 陈伟杜凌霞陈红
- 关键词:多核
- 概率图上的对象相似度计算被引量:1
- 2011年
- 在图挖掘领域,对象之间的相似度作为一个非常重要的课题,被广泛应用于链接预测、欺诈检测、协同过滤、近邻查询等众多实际问题中.在传统确定图上,节点相似度的研究受到了广泛关注并取得了很多成果.但是确定图上的对象相似度的计算无法直接应用于概率图.研究概率图上的节点相似度计算问题,定义了概率图上的期望SimRank相似度,提出了多项式时间复杂度的CBT算法计算期望转移矩阵,避免了可能世界的枚举.并通过链接预测实验和性能对比实验验证了相似度的质量和所提出算法的高效性、可扩展性.
- 杜凌霞李翠平陈红张应龙
- 关键词:相似度计算不确定性
- 不确定图上的kNN查询处理被引量:7
- 2011年
- 在现实中的许多领域产生大量不确定的图结构的数据,例如分子化合物、蛋白质交互网络等.同时现实中有很多应用例如推荐系统中的推荐过滤、欺诈检测和社会网络的链接预测等,需要查询给定节点的k个最相似节点,针对这一问题,提出了用基于SimRank度量的方法来求解.由于图的动态演变和不确定性导致用现有的SimRank计算方法求k个最近邻的代价昂贵,因此提出一个有效算法,在保证一定准确性的前提下,通过引入路径阈值,算法只需考虑查询点的邻居区域无需考虑整个图从而达到明显的剪枝效果,该方法在确定图和不确定图上都可以适用.在此基础上为了进一步提高效率,算法在不确定图上引入采样技术.最后从理论、实验说明验证了算法的高效性和有效性.
- 张应龙李翠平陈红杜凌霞
- 关键词:SIMRANKKNN子图