王林
- 作品数:1 被引量:6H指数:1
- 供职机构:南京航空航天大学民航学院/飞行学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的K均值聚类算法被引量:6
- 2010年
- k均值算法是聚类方法中常用的一种划分方法,有很多优点,但也存在不足之处,它对球状、凸形分布的数据具有很好的聚类效果,但对样本的输入顺序敏感,可能产生局部最优解,而且受孤立点影响比较大。本文针对这些不足之处,主要从数据预处理,初始聚类中心的选择和迭代过程聚类种子计算三方面进行改进,并做了改进前后算法的对比实验。结果表明,改进后的算法比原k均值算法具有更高的准确性,受孤立点的影响也大大降低。
- 王林吴海桥郑友石
- 关键词:K均值聚类聚类中心数据挖掘