张露
- 作品数:3 被引量:12H指数:3
- 供职机构:兰州理工大学电气工程与信息工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进FSVM的数据挖掘分类算法被引量:6
- 2016年
- 针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度慢以及对噪声点敏感影响分类正确率的问题,提出一种基于改进FSVM的数据挖掘分类算法.该算法首先预选有效的候选支持向量,减小训练样本数目,提高训练速度;其次定义一种新的隶属度函数,增强支持向量对构建模糊支持向量机的作用;最后将近邻样本密度应用于隶属度函数设计,降低噪声点或野值点对分类的影响提高分类正确率.实验结果表明,该算法在训练样本数目较大时训练速度和分类正确率都有提高.
- 赵小强张露
- 关键词:数据挖掘
- 基于SVM的高维不平衡数据集分类算法被引量:3
- 2018年
- 由于数据量的不断增长,出现了大量的不平衡高维数据,传统的数据挖掘分类算法在处理这些数据时,易受到样本分布和维数的影响,存在分类性能不佳的问题.提出一种针对不平衡高维数据集的改进支持向量机(Supported Vector Machine,SVM)分类算法,首先通过核函数将数据集映射到特征空间中,再引入改进的核SMOTE(Kernel Synthetic Minority Over-sampling Technique)算法而得到正类样本,使两类样本数目平衡化;然后将维数高的数据集通过稀疏表示的方法投影到低维的空间中,实现降维;最后根据空间的距离关系来确定在输入空间中合成样本的原像,再对得到的平衡样本集通过SVM来分类,通过仿真实验验证了该算法对于高维不平衡数据集有较优的分类性能.
- 赵小强张露
- 一种改进的数据挖掘模糊支持向量机分类算法被引量:3
- 2017年
- 针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度及分类速度慢的缺点,提出一种改进的数据挖掘模糊支持向量机分类算法.该算法首先预选有效的候选支持向量缩减训练样本集的规模提高训练速度;其次提出一种新的模糊隶属度函数,增强支持向量对构建模糊支持向量机最优分类超平面的作用,并用经过预选的训练样本集进行训练FSVM得到支持向量集;最后,运用粒子群优化算法选择最优支持向量子集,使用平均分类误差作为适应度函数,最终粒子输出时,将样本隶属度与设定阈值相比较,选择出支持向量集中相对较大隶属度的样本作为新的支持向量,提高分类速度.实验结果表明,该算法在不损失分类精度的情况下,提高了模糊支持向量机的训练速度和分类速度.
- 赵小强张露
- 关键词:数据挖掘模糊支持向量机粒子群优化