职为梅
- 作品数:26 被引量:57H指数:5
- 供职机构:郑州大学更多>>
- 发文基金:国家自然科学基金河南省自然科学基金河南省科技攻关计划更多>>
- 相关领域:自动化与计算机技术文化科学经济管理电子电信更多>>
- 抽样技术和CBES分类非平衡数据集
- 2013年
- CBES是面向非平衡数据集分类的组合选择方法。相关的实验表明,CBES方法能大幅度提升基分类器的泛化能力。已有研究表明,抽样方法能有效提高分类器在非平衡数据集分类上的性能。因此,巧妙地将抽样技术应用到CBES方法中,进而提出基于抽样的CBES方法(SCBES),以期进一步提高CBES在稀有类上的性能。大量的实验表明,巧妙地使用抽样方法能进一步提高CBES方法在非平衡数据集分类上的性能。
- 职为梅郭华平范明
- 关键词:非平衡数据集组合分类器抽样技术
- 一种面向非平衡数据集分类问题的组合选择方法被引量:7
- 2014年
- 由于类分布的不平衡性,很多传统的分类方法在非平衡数据集上的分类效果不好.与传统的方法不同,论文从组合选择的角度考虑不平衡类学习问题,提出了一种基于实例的组合选择方法 CBES,提升组合分类器在不平衡数据集上的分类性能.CBES考察类标号未知的样本的k近邻,并以此为选择集,从分类器库中选择一个最优或次优的子组合分类器来预测未知样本的类标号.由于考虑了待分类样本的局部特征,更关注稀有类,因此CBES能够更好地对非平衡数据集进行分类.实验结果表明,本文的方法能够显著地降低模型的复杂度,有效地提高了非平衡数据集上的分类性能.
- 职为梅郭华平张银峰范明
- 关键词:非平衡数据集组合分类器K近邻
- 抽样技术和CBES分类非平衡数据集
- ES是面向非平衡数据集分类的组合选择方法.相关的实验表明,CBES方法能大幅度提升基分类器的泛化能力.已有研究表明,抽样方法能有效提高分类器在非平衡数据集分类上的性能.因此,巧妙地将抽样技术应用到CBES方法中,进而提出...
- 职为梅郭华平范明
- 关键词:非平衡数据集抽样技术性能评价
- 样本大小对非平衡数据分类的影响
- 2010年
- 探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素——样本大小对稀有类的影响进行了研究。
- 职为梅范明叶阳东
- 关键词:稀有类组合分类器
- 一种面向不平衡数据分类的组合剪枝方法被引量:12
- 2014年
- 传统的数据分类算法多是基于平衡的数据集创建,对不平衡数据分类时性能下降,而实践表明组合选择能有效提高算法在不平衡数据集上的分类性能。为此,从组合选择的角度考虑不平衡类学习问题,提出一种新的组合剪枝方法,用于提升组合分类器在不平衡数据上的分类性能。使用Bagging建立分类器库,直接用正类(少数类)实例作为剪枝集,并通过MBM指标和剪枝集,从分类器库中选择一个最优或次优子组合分类器作为目标分类器,用于预测待分类实例。在12个UCI数据集上的实验结果表明,与EasyEnsemble、Bagging和C4.5算法相比,该方法不但能大幅提升组合分类器在正类上的召回率,而且还能提升总体准确率。
- 张银峰郭华平职为梅范明
- 关键词:不平衡数据集
- 面向不平衡图像数据的对抗自编码器过采样算法
- 2024年
- 许多适用于低维数据的传统不平衡学习算法在图像数据上的效果并不理想。基于生成对抗网络(GAN)的过采样算法虽然可以生成高质量图像,但在类不平衡情况下容易产生模式崩溃问题。基于自编码器(AE)的过采样算法容易训练,但生成的图像质量较低。为进一步提高过采样算法在不平衡图像中生成样本的质量和训练的稳定性,该文基于生成对抗网络和自编码器的思想提出一种融合自编码器和生成对抗网络的过采样算法(BAEGAN)。首先在自编码器中引入一个条件嵌入层,使用预训练的条件自编码器初始化GAN以稳定模型训练;然后改进判别器的输出结构,引入一种融合焦点损失和梯度惩罚的损失函数以减轻类不平衡的影响;最后从潜在向量的分布映射中使用合成少数类过采样技术(SMOTE)来生成高质量的图像。在4个图像数据集上的实验结果表明该算法在生成图像质量和过采样后的分类性能上优于具有辅助分类器的条件生成对抗网络(ACGAN)、平衡生成对抗网络(BAGAN)等过采样算法,能有效解决图像数据中的类不平衡问题。
- 职为梅常智卢俊华耿正乾
- 关键词:过采样
- 稀有类分类问题研究被引量:8
- 2005年
- 探讨了稀有类问题的区分性、多态性、稀有性等主要特征,详述了稀有类分类算法的评估标准。研究了目前分类稀有类的四种方法,首次提出使用基本显露模式分类稀有类的思想。
- 刘艳霞刘艳霞职为梅
- 关键词:数据挖掘稀有类
- 并行化的粒子群技术被引量:2
- 2009年
- 并行化是提高大规模复杂问题求解效率的有效手段。本文在分析了粒子群算法(Particle Swarm Optimization,PSO)的并行性后,给出了PSO算法的并行实现,并将该并行化的算法在并行平台——联想深腾1800机群系统上进行测试。结果表明PSO算法的并行实现,显著地提高了算法的效率。
- 吴正娟职为梅杨勇范明
- 关键词:并行化PSO算法
- EPTPC:一种改进的两阶段分类算法
- 2011年
- 分类是数据挖掘中的重要任务之一。基本显露模式(eEPs)是一种有趣的知识模式,能够反映两个不同数据集之间的某些显著差异并减少分类噪音,适合解决针对稠密数据集和高维数据集的分类问题。但是,传统的采用顺序覆盖策略分类算法无法解决小覆盖问题和反例碎片问题。提出了一种改进的基于eEPs模式的两阶段分类算法,它将eEPs模式作为分类模式,采用两阶段思想来构造分类器,特别是优化了评分策略和两个阶段的权重设置。同时与NB,CBA,C5.0,CMAR,CAEP,BCEP等方法的分类结果进行了比较,在UCI机器学习库中的11个数据集上的实验结果表明了文中提出的算法的有效性。
- 孙宜贵职为梅
- 关键词:数据挖掘基本显露模式
- 基于Mobile-Agent的实时控制环境的研究
- 1.引言随着企业信息化建设的不断发展,计算机集成制造系统成为企业改善管理,实现生产、经营、服务自动化,提高运作效率的主要手段。目前企业大多采用集散型控制系统(DCS),现场总线控制系统(FCS)。DCS和FCS提供相应的...
- 蔡国强范明张静职为梅
- 关键词:JAVA
- 文献传递