江苏省自然科学基金(BK2010331)
- 作品数:7 被引量:18H指数:3
- 相关作者:朱玉全陈耿杨传振李珊珊尹光更多>>
- 相关机构:江苏大学东南大学南京审计大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的分类器选择集成算法被引量:3
- 2012年
- 为提高集成分类器系统的分类性能,提出一种分类器选择集成算法MCC-SCEN。该算法选取基分类器集中具有最大互信息差异性的子集和最大个体分类能力的子集,以确定待扩展分类器集,选择具有较大混合分类能力的基分类器加入到待扩展集中,构成集成系统,进行加权投票并产生结果。实验结果表明,该方法优于经典的AdaBoost和Bagging方法,具有较高的分类准确率。
- 尹光朱玉全陈耿
- 关键词:多分类器系统
- 一种基于粗糙集属性约简的多分类器集成方法被引量:7
- 2012年
- 为提高多分类器系统的分类精度,提出了一种基于粗糙集属性约简的分类器集成方法 MCS_ARS。该方法利用粗糙集属性约简和数据子集划分方法获得若干个特征约简子集和数据子集,并据此训练基分类器;然后利用分类结果相似性得到验证集的若干个预测类别;最后利用多数投票法得到验证集的最终类别。利用UCI标准数据集对方法 MCS_ARS的性能进行测试。实验结果表明,相较于经典的集成方法,方法 MCS_ARS可以获得更高的分类准确率和稳定性。
- 杨传振朱玉全陈耿
- 关键词:粗糙集属性约简
- 基于聚类的数据敏感属性匿名保护算法被引量:4
- 2012年
- 为了防止数据敏感属性的泄露,需要对数据敏感属性进行匿名保护。针对l-多样性模型当前已提出的算法大多是建立在概念层次结构的基础上,该方法会导致不必要的信息损失。为此,将基于属性泛化层次距离KACA算法中的距离度量方法与聚类结合,提出了一种基于聚类的数据敏感属性匿名保护算法。该算法按照l-多样性模型的要求对数据集进行聚类。实验结果表明,该算法既能对数据中的敏感属性值进行匿名保护,又能降低信息的损失程度。
- 李珊珊朱玉全陈耿
- 关键词:聚类信息损失
- 基于PSO拓展的多分类器加权集成方法被引量:2
- 2012年
- 在多分类器集成时,每个基分类器的效能不同,如每个权值都相同,则会影响基分类器发挥作用。基于此,提出基于PSO拓展的多分类器加权集成方法 BCPSO。该方法采用随机子空间生成各个独立的子分类器,输出结果通过各分类器加权投票组合规则集成。实验结果表明,该方法有效可行,具有较高的分类正确率。
- 刘擎超朱玉全陈耿
- 关键词:分类器随机子空间粒子群优化
- 基于局部类别分析和遗传算法的查询优化算法被引量:1
- 2014年
- 查询扩展是信息检索中优化查询的一种有效方法。针对信息检索中用户查询关键词与文档标引词不匹配的问题,提出一种基于局部类别分析和遗传算法的查询优化算法。该算法分两个阶段实现:第1阶段对用户提交的查询Qold进行扩展,采用基于局部类别分析的查询扩展方法选择查询扩展词构成新查询Qnew;第2阶段对新查询Qnew进行权重分配,采用遗传算法对扩展后的查询进行权重调整得到最优查询向量,再次对测试集中的文档进行二次检索。实验结果表明,该算法比单独使用局部上下文分析算法、局部类别分析算法均有更优的检索性能。
- 蒋然苗帅
- 关键词:信息检索查询扩展遗传算法
- 一种基于半监督的大规模数据集聚类算法被引量:1
- 2011年
- 待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性.
- 申彦宋顺林朱玉全
- 关键词:半监督聚类数据挖掘K均值聚类
- 一种基于时滞弱化策略的通用信度重估模型
- 2015年
- 为提高信度评估的可靠性,从改善信度评估时效性角度出发,提出一种改进的通用信度重估模型GMRR。该模型借助原始信度、历史信度、信度波动率和信度波动趋势4种基础数据,实现了信度评估时效性机制与现有信度重估机制的有效集成,从多个维度对原始信度展开重估。给出信度评估时效性机制采用的时滞弱化策略、GMRR模型描述及分量计算算法,对模型的信度重估效果进行实验评估,结果表明,与现有信度重估模型相比,该模型获得的重估信度接近于目标实体的真实行为,同时能抑制恶意实体的策略波动行为。
- 韩志耕陈耿王良民蒋健