徐乾
- 作品数:4 被引量:8H指数:2
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:山西省自然科学基金山西省回国留学人员科研经费资助项目国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于K-Means聚类算法的HDMA数据挖掘方法被引量:5
- 2021年
- 为了提高高维混合属性数据挖掘效果,提出基于K-Means聚类算法的高维混合属性数据挖掘方法。通过分析数值型数据和分类型数据相似度,获取高维混合属性数据度量标准,将簇中心点设为簇里点的平均数值或质心,引入最大距离自动生成k值策略与坐标转换策略,优化聚类结果;依据欧几里得距离聚类剩余数据,根据最大间距对应的数据中心点坐标与半径,实现数据集聚类划分;通过判定聚类后数据噪音类别,计算各类别中类异常因子,经过降序排列,挖掘并标记异常数据。仿真结果表明,所提方法对高维混合属性数据具有理想的聚类优势与较好的挖掘稳定性。
- 耿德志徐乾
- 关键词:聚类算法数据挖掘相似度
- 处理非平衡数据的粒度SVM学习方法被引量:3
- 2011年
- 通过多维关联规则挖掘,将粒度计算(Granular Computing,GrC)和支持向量机(Support Vector Machine,SVM)有效融合,提出一种粒度支持向量机(Granular SVM,GSVM)学习方法,称为AR-GSVM。该方法用于非平衡数据处理时,不仅可以有效降低分类器的复杂性,而且本质上可以进行并行计算以提高学习效率,同时提高分类器的泛化能力。考虑到保持数据在原始空间和特征空间的分布一致性,在AR-GSVM的基础上又提出核空间上的粒度支持向量机学习方法,称为AR-KGSVM,该方法具有更好的泛化性能。通过在UCI数据集上的实验表明:AR-GSVM和AR-KGSVM的泛化能力优于一些常用非平衡数据处理的方法。
- 徐乾王文剑张文浩
- 关键词:支持向量机粒度计算关联规则非平衡数据