您的位置: 专家智库 > >

国家自然科学基金(71061001)

作品数:4 被引量:25H指数:3
相关作者:韩萌王志海原继东贾文娟何丰更多>>
相关机构:北方民族大学北京交通大学更多>>
发文基金:国家自然科学基金北京市自然科学基金国家民委科研基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 1篇信息熵
  • 1篇增益
  • 1篇数据流
  • 1篇数据流挖掘
  • 1篇数据挖掘
  • 1篇条件互信息
  • 1篇频繁模式挖掘
  • 1篇中文
  • 1篇中文本体
  • 1篇网络
  • 1篇离散化
  • 1篇离散化方法
  • 1篇互信息
  • 1篇分类器
  • 1篇概念抽取
  • 1篇概念漂移
  • 1篇贝叶斯
  • 1篇贝叶斯网
  • 1篇贝叶斯网络
  • 1篇本体

机构

  • 4篇北方民族大学
  • 3篇北京交通大学

作者

  • 2篇王志海
  • 2篇韩萌
  • 1篇白凤伟
  • 1篇何丰
  • 1篇原继东
  • 1篇丁剑
  • 1篇贾文娟

传媒

  • 1篇计算机学报
  • 1篇西北师范大学...
  • 1篇计算机工程与...
  • 1篇计算机技术与...

年份

  • 1篇2015
  • 2篇2012
  • 1篇2011
4 条 记 录,以下是 1-4
排序方式:
一种基于相似性度量的离散化方法被引量:3
2012年
针对基于信息熵的离散化方法的不足,提出了一种应用相似性度量理论将数值型属性进行离散化的方法.数值型属性离散化后,每一个区间所获得的信息量用一个叫做代数-几何平均数距离公式的相似性度量公式来度量;区间的数目由训练数据集合的大小动态决定.将此方法和基于信息熵的离散化方法在一些数据集合上进行实验,并用朴素贝叶斯分类器对离散化后的数据集合进行分类,结果表明该方法有更好的分类正确率.
丁剑白凤伟
关键词:数据挖掘离散化信息熵
基于HowNet的中文本体学习方法研究被引量:6
2011年
目前针对国内在中文环境下本体学习的研究才刚刚起步的现状,对本体学习和HowNet进行了简单介绍,提出了基于HowNet的中文本体学习的主要思路。当前,本体学习的研究重点在于概念及概念间关系抽取。采用文本语料作为输入,首先对文本进行预处理,然后基于HowNet生成了一个领域语义词典,在本体学习中加入领域核心概念本体,在概念关系抽取阶段,采用基于HowNet的语义相似度计算方法。实验证明,提出的本体学习方法能够有效改进概念和概念间关系抽取的准确度。
贾文娟何丰
关键词:本体学习HOWNET概念抽取
一种基于时间衰减模型的数据流闭合模式挖掘方法被引量:16
2015年
数据流是随着时间顺序快速变化的和连续的,对其进行频繁模式挖掘时会出现概念漂移现象.在一些数据流应用中,通常认为最新的数据具有最大的价值.数据流挖掘会产生大量无用的模式,为了减少无用模式且保证无损压缩,需要挖掘闭合模式.因此,提出了一种基于时间衰减模型和闭合算子的数据流闭合模式挖掘方式TDMCS(Time-Decay-Model-based Closed frequent pattern mining on data Stream).该算法采用时间衰减模型来区分滑动窗口内的历史和新近事务权重,使用闭合算子提高闭合模式挖掘的效率,设计使用最小支持度-最大误差率-衰减因子的三层架构避免概念漂移,设计一种均值衰减因子平衡算法的高查全率和高查准率.实验分析表明该算法适用于挖掘高密度、长模式的数据流;且具有较高的效率,在不同大小的滑动窗口条件下性能表现是稳态的,同时也优于其他同类算法.
韩萌王志海原继东
关键词:数据流挖掘频繁模式挖掘概念漂移
采用信息排序的SuperParent算法的研究
2012年
为了提高贝叶斯分类器的分类性能,Keogh提出了以分类效率为基础的扩展贝叶斯网络分类算法SuperParent-TAN,这是一种依赖一个属性(one dependence estimator)的贝叶斯网络。这种算法不足之处在于查找超父节点(Super-Parent)和创建分类器工作的反复进行,时间花费较大。为了提高这种算法的分类效率,同时保证分类率,设计了基于信息增益和基于互信息的两种排序算法。通过在Weka平台上对UCI中32个数据集合的实验表明,基于信息排序的优化算法可以在保持分类正确率同时降低分类花费。
韩萌王志海
关键词:分类器条件互信息增益
共1页<1>
聚类工具0