欧阳为民
- 作品数:33 被引量:507H指数:12
- 供职机构:安徽大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金安徽省教委科研基金更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- KDD研究中的若干问题与方法被引量:16
- 1999年
- 在数据库中发现知识,又称为数据发掘,其目标是从大型数据集中发现先前未知的潜在有用的模式或知识。本文对该领域进行简要综述,并主要从数据库角度讨论若干数据发掘问题与方法。
- 欧阳为民郑诚
- 关键词:知识发现数据发掘数据库KDD
- 聚类金字塔树:一种新的高维空间数据索引方法被引量:20
- 2001年
- 提出了一种新的有效的高维空间数据索引方法———聚类金字塔树 .它先对不均匀分布数据进行聚类处理 ,然后对聚类的结果实施金字塔分割和存储 ,由此建立一种有效的索引结构 .文中给出了聚类金字塔树的几种查询算法 .实验证明 :处理不均匀分布数据时 ,聚类金字塔树无论在页面访问次数 。
- 张海勤欧阳为民蔡庆生
- 关键词:高维数据空间范围查询
- 数据库中加权关联规则的发现被引量:140
- 2001年
- 关联规则发现是数据库中知识发现研究中的热点课题 ,有着广泛的应用领域 .在现有的研究中 ,数据库中的各个项目是按平等一致的方式加以处理的 .然而 ,在现实世界数据库中却并非如此 ,不同的项目往往有着不同的重要性 .为了将它们反映出来 ,对项目引入权值 ,从而提出了新的加权关联规则问题 .由于项目权值的引入 ,频繁项目集的子集不再一定是频繁的 .为此 ,又提出了项目的 k-支持期望概念 ,并由此提出了加权关联规则的发现算法 .
- 欧阳为民郑诚蔡庆生
- 关键词:数据发掘知识发现加权关联规则数据库
- 一种在数据库中发现偏离模式的线性算法被引量:6
- 1998年
- 偏离检测是在数据库发现知识的一种重要的启发式方法.文中给出了偏离检测问题的形式化定义,提出了一种线性的偏离检测算法.算法的基本思想与我们人类的思维机制是一致的,即将使数据序列突然发生大幅度波动的数据认作例外.
- 欧阳为民蔡庆生
- 关键词:知识发现数据库
- 在大型数据库中多层序贯模式的发现被引量:19
- 1998年
- 在数据库中发现知识KDD是当今国际人工智能和数据库研究的新兴领域,序贯模式是其中的重要研究课题之一.文中将序贯模式的发现从单层(singlelevel)概念扩展到多层(multiplelevel)概念,提出了自顶向下逐层递进的方法在不同概念层发现序贯模式,并且为改善算法性能,又提出了3种改进方法.
- 欧阳为民蔡庆生
- 关键词:知识发现序贯模式数据库人工智能
- 国际知识发现与数据发掘工具评述被引量:23
- 2001年
- 数据库中的知识发现是一个正在迅速发展的新兴领域,受到了学术研究界和企事业单位的广泛重视。在过去几年间,知识发现工具主要用于研究环境;而现在,复杂的工具产品正不断出现。在本文中,我们概述常见知识发现任务及其解决方法,并按照知识发现与数据发掘工具的一般特征、数据库连接性和数据发掘特征这三大项指标分析研究43种具有代表性的软件产品,这些产品有的是研究原型,有的是商品化的。最后,我们指出为了有效地满足用户需求,以及为了解决那些尚未解决或尚未充分解决的问题,知识发现软件所应该具有的重要特性。
- 欧阳为民郑诚张燕
- 关键词:数据库知识发现
- FOXBASE~+教学的几个问题
- 1995年
- FOXBASE~+教学的几个问题欧阳为民(安徽大学计算中心合肥230039)目前,国内绝大多数高等院校以及各种计算机培训班都将FOXBASE”作为一门主要的计算机基础课程。然而,有关教材错误较多,给准确理解FOXBASE“的内容带来困难。笔者从事FO?..
- 欧阳为民
- 关键词:FOXBASE^+全国计算机等级考试宏代换库文件教学
- 发现序贯模式的增量式更新技术被引量:2
- 1998年
- 本文提出一种称为FAST的增量式更新技术,以处理因最低支持的改变而引起的序贯模式的维护问题。其主要思想是再次利用在对旧的最低支持度进行处理时所获得的信息。
- 欧阳为民蔡庆生
- 关键词:知识发现序贯模式增量式更新数据库
- 大型数据库中多层关联规则的元模式制导发现被引量:14
- 1997年
- 本文将元查询制导技术与多层关联规则发现技术结合起来,提出了发现多层关联规则的自顶向下逐层递进风格的元模式制导方法.元模式是一个预先确定待发现规则的形式的规则模板,从而可引导数据的发掘过程.
- 欧阳为民蔡庆生
- 关键词:元模式关联规则数据库
- 基于垂直数据分布的关联规则高效发现算法被引量:35
- 1999年
- 文章分析了在KDD研究中现有的关联规则发现算法关于频繁项目集的生成与测试方法,提出了一种新的基于垂直数据分布的关联规则发现算法.该算法无需复杂的Hash 数据结构,仅需对整个数据库作两次遍历,从而既方便了实现。
- 欧阳为民蔡庆生
- 关键词:关联规则数据分布数据库KDD