国家自然科学基金(70971067G0112)
- 作品数:5 被引量:17H指数:3
- 相关作者:陈圣磊谷瑞军陈耿汪加才更多>>
- 相关机构:南京审计大学江苏大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 数据流挖掘及其在持续审计中的可用性研究被引量:3
- 2011年
- 随着企业信息化程度的提高和互联网的普及,每天都会产生海量的实时数据,而数据流挖掘则为分析海量数据提供了一种新途径。数据流挖掘中的聚类、分类、离群点检测等算法的研究取得了进展,为在持续审计中应用数据流挖掘提供了可行性。本文提出的一种基于数据流挖掘的持续审计模型,克服了传统持续审计模型对审计端的存储能力要求高、占用大量硬件资源、联机分析时间长、对异常数据的发现滞后等缺点。
- 谷瑞军陈圣磊
- 关键词:数据流挖掘持续审计审计模型聚类离群点检测
- 复杂合著网络中的重叠社团发现与可视化被引量:4
- 2012年
- 指出随着互联网的发展和社交网络的广泛应用,学者之间的合作途径越来越多,学者具备多重的社团属性;但是,传统的基于聚类或模块度优化等社团划分方法往往将学者划分到唯一的社团。基于Salton方法构建合著网络,使用加权的链接聚类算法实现社团的聚类划分,该方法将节点间的边作为聚类对象,采用凝聚式层次聚类进行社团划分。因节点属于不同的边,因而可以归属于不同的社团,最终得到的社团可以部分重叠。为检验方法的有效性,使用基于C-DPLP的合著网络构建系统获取数据,构建合著网络;然后使用加权的链接聚类进行社团发现和可视化。结果表明,该方法能有效地发现部分重叠的合著社团,且社团的意义比较明确。
- 谷瑞军陈圣磊陈耿汪加才
- 关键词:链接聚类合著网络复杂网络
- 面向大规模数据集的近邻传播聚类被引量:8
- 2010年
- 近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用。为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分。实验结果表明,该算法在处理能力和运算速度上优于原算法。
- 谷瑞军汪加才陈耿陈圣磊
- 关键词:近邻传播聚类大规模数据集数据挖掘
- 图像搜索结果的滑动窗口多标记传播聚类被引量:1
- 2012年
- 针对图像聚类中数据量大、部分重叠等问题,提出一种基于滑动窗口的多标记传播聚类算法。首先根据图像距离计算图像间的相似度,设定阈值将相似度转变为链接,构造出一个无向图;然后应用基于滑动窗口的多标记传播算法对无向图进行社区划分。滑动窗口可以存放多个标记,从而一个图像可以归属于多个类别。对公开网络数据和搜索引擎返回的真实图像数据进行实验,结果表明,该方法能有效发现具有重叠划分的簇,且簇的意义比较明确。
- 谷瑞军陈圣磊陈耿汪加才
- 关键词:图像聚类图像距离
- 图像搜索结果的重叠层次聚类与代表点展现被引量:1
- 2012年
- 针对图像聚类中面临的高维、准确度低、部分重叠等问题,提出了一种高效的基于链接层次聚类的多标记图像聚类。该方法通过图像距离计算相似度,通过链接聚类检测重叠簇。从而每个图像可能归属于多个簇,使得簇标签的意义更明确。为了检验方法的有效性,对通过搜索引擎检索特定关键词返回的图片数据集进行聚类。结果表明,该方法能有效发现具有重叠划分的簇,且簇的意义比较明确。
- 谷瑞军陈圣磊陈耿汪加才
- 关键词:图像聚类链接聚类图像距离