孙秀娟
- 作品数:4 被引量:34H指数:3
- 供职机构:山东师范大学更多>>
- 发文基金:山东省自然科学基金山东省优秀中青年科学家科研奖励基金'泰山学者'建设工程专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于自识别交叉算子和自适应变异算子的遗传算法研究被引量:2
- 2008年
- 为有效地解决遗传算法收敛速度和局部最优解的矛盾,本文提出了一种具有自识别交叉算子和基于海明距离的动态变异算子的遗传算法。自识别交叉算子保证父代的优良模式遗传到下一代,加快了算法的收敛速度;而动态变异算子扩大了搜索范围,增强了算法跳离局部最优解的能力。实验证明,两种改进算子的有效结合保证算法能以较快速度收敛于全局最优解。
- 孙秀娟刘希玉李丽丽
- 关键词:遗传算法海明距离
- 基于初始中心优化的遗传K-means聚类新算法被引量:19
- 2008年
- 一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。
- 孙秀娟刘希玉
- 关键词:聚类遗传算法
- 基于遗传算法的K-means聚类算法分析研究
- 近年来,随着信息技术的发展,信息资源的经济和社会价值越来越重要。通过数据挖掘,从大量的数据资料中发现有价值的、人们感兴趣的信息或知识,可以达到为科学决策提供支持的目的。聚类分析是数据挖掘的一项基本任务,是一种无监督的分类...
- 孙秀娟
- 关键词:数据挖掘K-MEANS聚类算法遗传算法
- 文献传递
- 基于新聚类有效性函数的改进K-means算法被引量:5
- 2008年
- 在K-means算法中,聚类数k是影响聚类质量的关键因素之一。目前,已经提出了许多确定最佳k值的聚类有效性方法,但这些方法都不能很好地处理两种数据集:类(簇)密度不同的数据集和类间距比较小的数据集(含有合并簇的数据集)。为此,提出了一种新的聚类有效性函数,该函数定义为数据特征轴总长度的平方与最小类间距的比值,最佳聚类数为这个比值达到最小时对应的k值。同时,为减小K-means算法对噪声和孤立点数据的敏感性,使用了基于加权的改进K-平均的方法计算类中心。实验证明,与其他算法相比,基于新聚类有效性函数的K-wmeans算法不仅降低了噪声和孤立点数据对聚类结果的影响,而且能有效地处理上面提到的两种数据集,明显提高了数据聚类质量。
- 孙秀娟刘希玉
- 关键词:聚类K-MEANS算法聚类有效性