搜索到10121篇“ 特征选择算法“的相关文章
一种基于PSO的双种群双度量三档案的动态压缩扩张的特征选择算法
本发明公开了一种基于PSO的双种群双度量三档案的动态压缩扩张的特征选择算法,包括以下步骤:通过双种群双度量过滤策略,对两个种群分别应用不同的度量方法,初步完成高维数据的降维;对种群Sub<SUB>s</SUB>和种群Su...
康雁郑东升李东云袁虎彭浩凌永军彭越姚晟哲徐寿颢蔡鑫
一种基于间隔无变量消除特征选择算法的毒品开集识别方法
本发明公开了一种基于间隔无变量消除特征选择算法的毒品开集识别方法,包括以下步骤:步骤S1:准备样品;步骤S2:进行样品光谱采集;步骤S3:剔除异常的海洛因样品和冰毒样品,降低样品光谱数据中的噪音;步骤S4:使用间隔无变量...
李轲张鑫陈莹莹张正东邵云龙阳杰刘帆宋胜忠丁超民刘建龙张泽北
基于类间半径的自适应邻域特征选择算法
2025年
邻域粗糙集模型被广泛应用于特征选择领域,然而传统邻域粗糙集模型受限于网格搜索法,且存在仅从特征角度确定邻域的粒度和特征评价函数构造视角单一等问题.针对上述问题,提出一种基于类间半径的自适应邻域特征选择方法.首先,提出类间半径的概念,从样本角度与特征角度出发,为不同类的样本生成相应的邻域半径,构造了基于类间半径的自适应邻域粗糙集模型,并基于此定义了自适应邻域互信息.其次,由类间边界引出类间系数,并将其与自适应邻域互信息结合,进而构造了类间互信息这一特征评价函数,该函数从代数和信息论视角评价特征.最后,设计一种基于类间半径的自适应邻域特征选择算法.通过在8个UCI数据集上与5种算法进行实验对比分析.实验结果表明,所提算法选择特征数量和分类精度上优于其他算法.
徐久成马妙贤张杉白晴
关键词:自适应邻域邻域粗糙集
基于评分机制的类贪心森林优化特征选择算法
2025年
森林优化特征选择算法(FSFOA)具有良好的分类性能和维度缩减能力,但其初始化森林的质量参差不齐,局部播种和全局播种的随机性较大,且适应度评估代价较高导致计算效率较低.针对上述问题,提出一种基于评分机制的类贪心森林优化特征选择算法(FSGLFOA-SM).首先,以每维决策变量的分类精度为其得分构建评分机制,提出类贪心初始化策略以生成较优质的初始化森林;其次,提出基于评分比较的类贪心局部播种策略,使评分相对较高的决策变量获得更大的局部播种概率;然后,在全局播种阶段提出类贪心遗传算子播种策略,对候选森林择优重建并进行遗传、类贪心交叉和变异操作,以保留评分较高的特征维度,有利于提高全局播种阶段的分类准确率;最后,为解决昂贵适应度评估带来的计算效率低下问题,建立历史数据库,在适应度评估前先进行库内查找,减少了重复解个体的计算量.实验结果表明,相比9个对比算法,FSGLFOA-SM在16个UCI数据集上的分类精度和维度缩减率更加优越.
王霞王霞王勇王卓然
关键词:评分机制初始化
基于SFE的不平衡数据二阶段特征选择算法
2025年
在数据处理领域,高维特征与类别不平衡问题已成为诸多研究面临的棘手挑战。鉴于此,文章以SFE算法作为坚实基石,创新性地提出了一种专门面向不平衡数据情境的二阶段特征选择算法——SFE-TSFS(a two-stage feature selection algorithm for imbalanced data based on SFE)。首先,针对SFE算法未能处理类别不平衡的局限,SFE-TSFS引入了Borderline-SMOTE方法生成符合要求的边界样本,以平衡数据分布。其次,为加速算法收敛并降低计算成本,在初始特征筛选阶段结合了模糊互信息方法,有效去除大量冗余特征。实验结果表明,与原SFE算法相比,文章所提出的算法在保证分类准确率的同时,运行时间和特征数量上均优于SFE算法,验证了SFE-TSFS算法的有效性。
沈先倩杨盛毅陈静何小飞程俞富
关键词:高维数据不平衡数据
面向不平衡医疗数据的多阶段混合特征选择算法
2025年
为解决医疗数据中存在的特征高维和类别不平衡问题,在基于简单、快速和有效高维特征选择算法SFE(simple,fast and effective high-dimensional feature selection)的基础上,提出了一种面向不平衡医疗数据的多阶段混合特征选择算法HFSIM(hybrid feature selection for imbalanced medical data)。HFSIM算法采用改进的自适应边界SMOTE过采样技术,生成符合边界条件的新少数类实例以解决医学数据中类不平衡问题。同时,为了改善搜索空间多样性不足的问题,优化了SFE算法中的非选择操作符率参数UR(unselected rate),有效避免了算法过早收敛及易陷入局部最优的问题。将过滤式Fisher Score方法与优化UR参数后的算法有效结合,使算法能以较低的计算成本获得较好寻优能力。经实验验证,相比于SFE算法,HFSIM算法在Ovarian数据集上准确率达到99.67%,提升了2.11个百分点,G-means和F1分别提升了5.13和2.30个百分点。此外,通过对比特征数量和运行时间,证明了HFSIM算法既能保证算法精度又有效降低了计算成本。
刘佳璇李代伟任李娟张海清张海清杨瑞
关键词:医疗数据
混合层次依赖度下的邻域粗糙集多目标特征选择算法
2025年
精度和效率是评判特征选择算法性能的关键指标,分别对应邻域粗糙集的属性依赖度和约简规模,而已有的特征选择算法通常以属性约简的最大依赖度为导向进行寻优,忽略了约简规模的重要性。现实中,随着数据特征维度的增加和类别层次结构的出现,导致类别信息复杂且结构关系混乱,传统属性依赖度计算未有效利用类别层次结构信息,使得分类性能不佳。鉴于此,本文构造了一种综合考量属性重要度和类别层次结构关系的混合层次依赖度,将混合层次依赖度和约简规模作为两个独立的优化目标,引入多目标进化算法对其分别进行优化,从属性依赖度和属性规模两方面提升所得属性约简的性能,以得到满足目标约束的约简结果。数据实验分析结果表明,所提算法能够在目标约束内得到更高质量的约简结果,并且能够提高分类精度。
骆公志张尚蕾
关键词:邻域粗糙集属性约简
面向动态混合数据的多粒度增量特征选择算法
2025年
在大数据时代,样本规模以及维数的动态更新和变化极大地增加了计算负担,在这些动态数据中,大多的数据样本并不以单一的数据取值形式存在,而是同时包含符号型数据和数值型数据的混合型数据.为此,学者们提出了许多关于混合数据的特征选择算法,但现有的算法大多只适用静态数据或者小规模的增量数据,无法处理大规模动态变化的数据,尤其是数据分布不断变化的大规模增量数据集.针对这一局限性,通过分析动态数据中粒空间以及粒结构的变化和更新,基于信息融合机制,提出了一种面向动态混合数据的多粒度增量特征选择算法.该算法重点讨论了动态混合数据中的粒空间构建机制、多数据粒结构的动态更新机制以及面向数据分布变化信息融合机制.最后,通过与其他算法在UCI数据集上的实验结果进行对比,进一步验证了所提算法的可行性和高效性.
王锋姚珍梁吉业
关键词:信息融合
具有混合策略的樽海鞘群特征选择算法被引量:1
2024年
近年来,随着计算机和数据库技术的快速发展,大规模数据集迅速增长,利用特征选择技术来筛选信息量大的特征已经变得非常重要。本文提出了一种具有混合策略的樽海鞘群特征选择算法(salp swarm feature selection algorithm with hybrid strategy,HS-SSA)。首先,本文生成一张基于互信息的排序表,并由排序表提出了新的初始化策略。其次,提出一个新颖的并且有条件调用的动态搜索算法。最后在位置更新上结合瞬态搜索算法(transient search algorithm,TSO),改进勘探和开发步骤的效率,增加解空间的灵活性和多样性,从而使算法能够快速定位到全局最优位置。为了验证算法的性能,实验选取14个UCI的数据集,并且与樽海鞘群算法(SSA)以及近几年樽海鞘群的改进算法等多种优化算法进行比较,结果表明HS-SSA在特征选择上具有更强的竞争力。
余紫康董红斌
关键词:启发式算法互信息秩和检验K近邻
基于ReliefF的在线层次流特征选择算法
人工智能和物联网的广泛存在导致大量数据的快速生成与聚合,特征选择技术能够显著减少数据维度,提高模型性能。但在涉及具有众多特征的机器学习任务中,仍然存在样本数量大、特征超高维的问题,并且特征空间具有流动性、数据类别之间通常...
任梦丽
关键词:RELIEFF算法

相关作者

周红芳
作品数:106被引量:221H指数:5
供职机构:西安理工大学
研究主题:聚类 数据集 文档频率 测试集 特征选择算法
李占山
作品数:87被引量:355H指数:11
供职机构:吉林大学计算机科学与技术学院
研究主题:约束满足问题 人工智能 弧相容 产品配置器 特征选择算法
林耀进
作品数:66被引量:215H指数:8
供职机构:闽南师范大学
研究主题:协同过滤 多标记 特征选择算法 邻域粗糙集 终端设备
王晨曦
作品数:13被引量:46H指数:3
供职机构:漳州职业技术学院计算机工程系
研究主题:特征选择算法 互信息 多标记 邻域粗糙集 粒计算
杨宏晖
作品数:59被引量:113H指数:7
供职机构:西北工业大学航海学院
研究主题:水声目标识别 水下目标识别 支持向量机 卷积神经网络 水声目标