尹健
- 作品数:6 被引量:16H指数:2
- 供职机构:中南大学地球科学与信息物理学院更多>>
- 发文基金:国家高技术研究发展计划长沙市科技计划项目湖南省自然科学杰出青年基金更多>>
- 相关领域:天文地球自动化与计算机技术更多>>
- 一种面要素的层次四叉树聚类方法被引量:1
- 2015年
- 确定重点监测区域是地灾应急响应中的一个重要环节。为了快速圈定监测范围,可以使用数据挖掘中的聚类方法。以粗略的监测区域作为工作区域,利用基于层次四叉树的面要素聚类方法缩小救灾范围。结合层次划分与四叉树剖分方法,将工作区域划分为包含面要素和相交面要素的单元格集合,在单元格集合中遍历搜索四方向邻近单元格,并将其聚合成多边形,从而实现面要素聚类。阐述了算法的可用性,通过实验分析了算法的复杂度,并对比分析了算法性能,进而利用面积差指标分析了层高对聚类多边形形状特征的影响。
- 李光强职露尹健
- 关键词:聚类单元格
- 微博文本挖掘研究综述被引量:5
- 2017年
- [目的/意义]梳理国内外微博文本挖掘的研究现状,展望未来的研究方向。[方法/过程]介绍微博文本挖掘的背景和意义,从微博的数据获取、文本语义挖掘方法及应用研究3个方面,对比微博数据获取的不同方式,分析文本预处理过程和文本处理的若干方法,总结当前微博数据的应用现状。[结果/结论]微博数据获取技术主要有基于API、基于网络爬虫和基于网络数据流3种方式;微博文本挖掘涉及文本分类和聚类、话题检测、情感分析等方法;微博数据在舆情分析、商业营销及社会服务等方面已经得到广泛应用。
- 余容李光强尹健
- 关键词:文本挖掘情感分析
- 利用缓冲区实现面要素聚类
- 2016年
- 基于缓冲区分析发展了一种简洁、高效的面要素聚类方法。从面要素集中取出一个要素作为核要素,根据给定的半径绘制面缓冲区;根据缓冲区递归搜索邻近区域得到核要素的所有可达和相连要素;判断可达和相连要素是否满足聚类需求来确定是否将其聚为一类。通过实验证明了方法的可行性,并通过对比分析了方法的聚类效率。
- 李光强尹健职露
- 关键词:缓冲区
- 自发地理信息研究综述被引量:8
- 2016年
- 为了解当前自发地理信息的发展现状、存在问题和发展前景,对自发地理信息展开了研究。首先,介绍了自发地理信息的概念及其研究背景;然后,归纳统计了目前相关的研究文献,分析了自发地理信息的研究现状及其研究中亟待解决的难题;接着,根据研究侧重点的不同,将当前的自发地理信息研究领域总结为数据获取、数据处理和数据应用三个方面,并分别探讨各方面的研究现状、研究成果以及不足。最后,结合大数据研究背景,展望了自发地理信息的未来研究方向。研究表明,自发地理信息已成为地理信息的一个重要发展方向,但其数据处理、应用的理论和方法仍有待完善。
- 尹健李光强职露余容
- 关键词:大数据数据质量
- 基于线平衡点的时空演化分析被引量:1
- 2015年
- 时空演化分析是时空数据挖掘和知识发现的研究热点之一。为实现定量表达线要素地理属性的时空演化特征,在力矩平衡原理的基础上,提出一种基于线平衡点的时空演化分析定量表达方法。该方法将地理属性力矩定义为线要素上各点地理属性值与该点到平衡点的线上距离的向量乘积,然后利用物理学力矩平衡计算公式求得力矩平衡点的位置。当不同时刻各点的地理属性值发生变化时,平衡点位置亦随之不断移动,进而利用平衡点与均质平衡点的偏移向量以及相邻时刻之间平衡点的转移向量,定量地表达线要素地理属性的时空演化特征。最后,通过实验验证了该方法的可行性以及有效性。
- 李光强职露尹健王彦坤
- 关键词:力矩平衡
- 基于TIN的面要素聚合优化算法被引量:1
- 2015年
- 针对TIN三角网在实现地图面要素聚合过程中效率低下的问题,提出了一种基于TIN面要素聚合的优化方法。首先,利用格网的方法聚类面要素,缩小TIN搜索范围;然后,在聚类的基础上进行TIN三角网的构建实现面要素的综合;最后,实验验证了综合结果,并通过对比证明了算法的效率。
- 王彦坤李光强尹健职露
- 关键词:格网聚类