韩岩
- 作品数:2 被引量:15H指数:1
- 供职机构:中国科学院新疆理化技术研究所更多>>
- 发文基金:中国科学院西部之光基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 加速大数据聚类K-means算法的改进被引量:14
- 2015年
- 为有效处理大规模数据聚类的问题,提出一种先抽样再用最大最小距离进行K-means并行化聚类的方法。基于抽样的方法避免了聚类陷入局部解中,基于最大最小距离法使得初始聚类中心趋于最优化。大量实验结果表明,无论是在单机环境还是集群环境下,该方法受初始聚类中心的影响降低,提高了聚类的准确性,减少了聚类的迭代次数,降低了聚类的时间。
- 韩岩李晓
- 关键词:K-均值算法并行化
- 用Fluent与MongoDB构建高效海量日志采集系统被引量:1
- 2014年
- 由于传统方法不能满足海量日志存储的需求,对于海量日志的分析传统方法也出现了瓶颈问题,所以本文通过不同类型存储介质对海量日志读写性能实验,并与日志采集软件相结合提出了解决存储海量日志的一种方案:用Fluent(日志采集软件)与MongoDB来构建日志采集系统。实验表明:这种方式与传统存储方式相比,突破单机环境下日志存取的瓶颈,大幅度提高海量日志的存取速度,简化了日志分析与统计操作。在MongoDB集群环境下,高并发的读写满足了海量日志存取的需求,并且这种集群具有可扩展性和高可用性。
- 韩岩李晓
- 关键词:FLUENTMYSQLMONGODBHADOOP