芦俊丽
- 作品数:7 被引量:10H指数:1
- 供职机构:云南大学信息学院更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金云南省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 空间高效用Co-location模式挖掘技术初探被引量:9
- 2014年
- 空间Co-location模式是一个空间特征集,集合中各个特征的实例在邻近区域内频繁并发出现.在经典的频繁模式挖掘研究中,最近的突破之一是将效用概念作为新的兴趣度量,它允许事务中同一个项可以有多个实例出现且不同的项可以具有不同价值.本文将效用概念引入到空间Co-location模式挖掘中,定义了模式效用、模式效用率等概念,提出一种基础算法挖掘空间高效用Co-location模式.接着定义了扩展模式效用,并根据它的反单调性提出一种剪枝策略:完全剪枝算法,加快了空间高效用Co-location模式的产生.最后通过大量实验来说明完全剪枝算法的效果和效率.
- 杨世晟王丽珍芦俊丽高源
- 空间co-location模式挖掘及决策支持的理论和方法研究
- 王丽珍周丽华周小兵陈红梅肖清赵丽红芦俊丽
- “移动互联网才是真正的互联网”是刚刚过去的2014年业界著名的一句话,因为它“将连接一切,颠覆所有行业”。移动互联网除了随时随地可以连接在线以外,更核心的是可以提供位置服务。位置数据是一类空间数据,空间co-locati...
- 关键词:
- 关键词:移动互联网
- 基于耦合关系的医生用药异常分析
- 2017年
- 近些年来,医患关系受到广泛关注。如何准确地挖掘异常用药是制约医生和缓减医患关系的关键。本文提出了一种检测医生用药异常的总体框架。该框架集成处方数据的耦合相似度度量和变色龙聚类算法,并分为三个阶段,定性分析,定量分析和异常检测。在真实处方数据上进行了充分的实验,实验验证了该框架能够有效地检测出医生用药异常。
- 王丽珍芦俊丽邓世昆张静
- 关键词:聚类
- 从动态空间数据库中挖掘有趣的空间模式
- 随着GPS和遥感等技术的发展,产生了大量的空间数据。如何有效利用这些空间数据挖掘隐含其中的有趣的空间模式,成为迫切需要解决的问题。空间数据挖掘就是从大量空间数据中挖掘有趣的、事先未知却潜在有用的知识和模式的过程。空间co...
- 芦俊丽
- 关键词:空间数据挖掘
- 文献传递
- 基于植物与生态环境的空间数据仓库和空间数据挖掘研究
- 王丽珍周丽华陈红梅肖清赵丽红李海波芦俊丽
- 计算机数据采集和存储技术的发展,使得数据量急剧膨胀,造成“数据海量而知识贫乏”的瓶颈。在这些数据中,大约80%与地理分布有关,称为空间数据。因此空间数据仓库和空间数据挖掘应运而生。相对于一般数据而言,空间数据不仅包括实体...
- 关键词:
- 关键词:数据仓库数据挖掘植物
- 广义关联分析的蕴涵-约束框架及其挖掘算法被引量:1
- 2014年
- 本文将所有基于事务和非基于事务的关联分析称为广义的关联分析。基于事务的关联分析主要依托支持度-置信度框架进行数据挖掘,而非基于事务的关联分析常采用参与度-条件概率框架。首先,在讨论强关联规则的正确性、可靠性和有趣性的基础上,提出了蕴涵-约束框架。其次,提出并论证了最小支持度_和最小置信度_的合理取值范围,从而将最小置信度由支持度-置信度框架下的(0,1]缩小为蕴涵-约束框架下的(0.5,1],最小支持度由(0,1]缩小为(0,_]。第三,提出随机顶点极大团划分法,它能将非基于事务的关联分析转化为基于事务的关联分析,从而使广义关联分析问题整合成为基于事务的关联分析问题。第四,基于映射的概念,将约束划分为事前、事中和事后约束,从而形式化地解决了约束的应用及方法。第五,利用稠密维和稀疏维,提出了一种multi-knowledge tree的树形存储结构,能在无论频繁项集是否满足向下闭合性质时都有效降低算法的空间复杂度;同时,在数据增加、删除、修改后能快速获取新的强关联规则。最后,大量实验验证了所提出理论和算法的效果和效率。
- 邹目权王丽珍姚华传芦俊丽
- KNN分类方法研究以及在数据预处理中的应用
- 本文主要从以下三个方面开展工作:
首先,对数据挖掘中的技术之一——数据分类进行研究。详细分析了现阶段比较常用的分类算法以及各自的优劣之后,重点分析了KNN分类方法的思想。总结出了传统KNN存在的三个缺陷。比较了...
- 芦俊丽
- 关键词:数据预处理KNN分类矢量地图数据
- 文献传递