搜索到20083篇“ 不平衡数据分类“的相关文章
一种基于多标签平衡数据分类的疾病预测方法
本发明属于疾病预测技术领域,具体涉及一种基于多标签平衡数据分类的疾病预测方法;该方法包括:获取带多种标签的医疗数据并对其进行预处理,得到预处理好的医疗数据;将医疗数据划分为各标签下的跨边界样本、自边界样本和内部样本;计...
苏祖强吴旗于洪胡峰王国胤
一种多标签平衡数据分类的机器学习方法及系统
本发明提供一种多标签平衡数据分类的机器学习方法及系统,所述基于二重高阶策略及进化计算采样方法的多标签平衡数据分类的机器学习的构建方法及系统混合使用特征型、标签型高阶策略扩展多标签平衡数据;融合进化计算方法,给出了多...
段继聪于化龙 段宝敏 姜元昊
基于循环一致生成对抗网络的平衡数据分类方法
本发明公开了一种基于循环一致生成对抗网络的平衡数据分类方法,主要解决现有技术中分类模型对噪声数据敏感、数据层方法合成样本存在类间重叠以及合成样本特征多样性匮乏的问题。其实现步骤为:1)对原始数据集进行预处理;2)根据预...
王利娟杨绪前
一种基于混合采样的平衡数据分类方法
本发明公开了一种基于混合采样的平衡数据分类方法。包括步骤:输入平衡数据集,并将其划分为训练、验证和测试数据集;将训练数据集分为正类和负类数据集;在负类数据集中,首先计算每个样本的分类难度,再利用层次聚类将其划分为多个...
韩飞王传真
一种最优过采样和邻域修正的平衡数据分类方法
本发明公开了一种最优过采样和邻域修正的平衡数据分类方法,属于平衡数据分类领域,该方法包括基于密度峰值选取少数类子集中的基准样本,将基准样本的近邻样本作为人工样本;生成合成样本,并将合成样本加入少数类子集,根据更新后的...
张震 田鸿朋 张天骏 靳金帅 司耀琦 高思涵 葛帅兵 肖宗荣张红霞 周麒 李友好 黄伟涛张俊杰 裴胜利 宋佳恒 王鹏宇 张诗仪赵昕宇
基于聚类算法的平衡数据分类
2024年
引言现有的平衡数据分类问题通常采用重采样和重加权等类重平衡策略,使决策边界倾向于准确分类尾部类的数据。但在类重平衡策略实施后,每个类别的类内分布变得更加松散,损害了深层特征的代表能力。因此,本文提出采用多粒度数据增强策略生成的新平衡样本集重新进行表征学习和分类
林肖莹胡敏杰张勇
关键词:不平衡数据分类聚类算法多粒度重采样
一种基于CGLOW的全局优化的平衡数据分类模型
本发明公开了一种基于CGLOW全局优化的平衡数据分类模型,属于平衡数据分类的领域。为了解决实际工业中某些类样本难以获取,造成数据平衡影响最终分类效果的问题,我们希望以生成的方式补充少数类的样本达到样本平衡,因此我们...
焦文华李俊雄蔡晓异朱永军马小平
一种基于CGLOW的全局优化的平衡数据分类模型
本发明公开了一种基于CGLOW全局优化的平衡数据分类模型,属于平衡数据分类的领域。为了解决实际工业中某些类样本难以获取,造成数据平衡影响最终分类效果的问题,我们希望以生成的方式补充少数类的样本达到样本平衡,因此我们...
焦文华李俊雄蔡晓异朱永军马小平
工业平衡数据分类方法、装置、电子设备及存储介质
本发明提供一种工业平衡数据分类方法、装置、电子设备及存储介质,首先获取原始平衡数据,该原始平衡数据中包含两类数据、且第一类数据数据量小于第二类数据数据量;进而对原始平衡数据中的第一类数据进行过采样,并将过采样...
卢伟董其良潘学军仲崇权
面向平衡数据分类的DPC-SMOTE过采样算法
2024年
针对平衡数据集中存在的噪声以及类内类间平衡问题,提出了基于密度峰值聚类过采样算法。首先对多数类样本进行预处理,筛选噪声样本并删除;其次,对所有少数类样本采用密度峰值聚类,剔除噪声点;再次,根据聚类后每个簇同的稀疏度分配采样权重,并计算每个簇需要合成的新样本数目;最后在每个簇内进行SMOTE过采样合成新样本。将提出的过采样算法与5种常用过采样算法对比,并分别与5种基分类器相结合,在10个平衡数据集上进行对比实验。实验结果表明:本文方法的F_(1)、G-mean、AUC分别最低可提升1.21%、0.94%、5.14%,最高可提升15.90%、14.99%、11.26%;证明该方法能够减少样本重叠,有效避免平衡数据集中噪声的产生,提升了分类精度。
刘志函张忠林赵磊
关键词:不平衡数据过采样稀疏度

相关作者

胡小生
作品数:19被引量:90H指数:6
供职机构:佛山科学技术学院
研究主题:聚类 不平衡数据 不平衡数据分类 支持向量机 K均值聚类
尹军梅
作品数:5被引量:40H指数:3
供职机构:南京师范大学计算机科学与技术学院
研究主题:过抽样 不平衡数据分类 不平衡数据集 不平衡数据 子空间
蒋盛益
作品数:169被引量:938H指数:17
供职机构:广东外语外贸大学
研究主题:聚类 数据挖掘 存储介质 聚类算法 印尼语
谢照青
作品数:3被引量:21H指数:1
供职机构:广东外语外贸大学国际工商管理学院
研究主题:不平衡数据分类 不平衡数据 朴素贝叶斯
李秋洁
作品数:93被引量:222H指数:9
供职机构:南京林业大学机械电子工程学院
研究主题:点云 行道树 果园 靶标 激光雷达