田凤占 作品数:20 被引量:317 H指数:9 供职机构: 北京交通大学计算机与信息技术学院 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 “九五”国家攀登计划 更多>> 相关领域: 自动化与计算机技术 理学 电子电信 更多>>
基于贝叶斯启发式方法的全国优化 传统的优化方法通过估计最大误差的界限来评价其结果,这种方法有代价是高昂的。贝叶斯方法可以看成通过先验分布使用启发式手段的一种间接的方式。贝叶斯启发式方法将贝叶斯方法用于随机化启发式,提供了一个包含专家知识的自然而方便的方... 林士敏 田凤占 陆玉昌关键词:贝叶斯方法 文献传递 基于KL距离的TAN分类器判别性学习方法 被引量:9 2008年 树增强朴素贝叶斯(TAN)分类器在模型的复杂性和分类精度之间实现较好折衷,成为当前分类器学习的一个研究热点.为了提高 TAN 分类器的分类准确率,本文提出一种基于 KL 距离的 TAN 分类器判别性学习方法.首先用 EAR 方法学习 TAN 分类器的结构,然后用基于 KL 距离的目标函数优化 TAN 的参数.在标准数据集上的实验结果表明,用该方法学习的 TAN 分类器具有较高的分类精度. 冯奇 田凤占 黄厚宽关键词:KL距离 EAR 一种用于贝叶斯分类器的文本特征选择方法 被引量:8 2008年 特征选择是文本分类中一种重要的文本预处理技术,它能够有效地提高分类器的精度和效率。文本分类中特征选择的关键是寻求有效的特征评价指标。一般来说,同一个特征评价指标对不同的分类器,其效果不同,由此,一个好的特征评价指标应当考虑分类器的特点。由于朴素贝叶斯分类器简单、高效而且对特征选择很敏感,因此,对用于该种分类器的特征选择方法的研究具有重要的意义。有鉴于此,提出了一种有效的用于贝叶斯分类器的多类别文本特征评价指标:CDM。利用贝叶斯分类器在两个多类别的文本数据集上进行了实验。实验结果表明提出的CDM指标具有比其它特征评价指标更好的特征选择效果。 陈景年 黄厚宽 田凤占 瞿有利关键词:文本分类 文本预处理 朴素贝叶斯 基于分布不完整数据选择性分类器 被引量:1 2008年 通过删除数据集中的无关属性和冗余属性构建的选择性分类器可以有效地提高分类精度和效率.由于处理不完整数据的复杂性,已有的选择性分类器大都是针对完整数据的.然而,现实中的数据通常是不完整的并且包含许多冗余属性或无关属性.为解决这一问题,在构建的不完整数据分类器DBNB的基础上给出了一种有效的选择性分类器:SDBNB.在12个标准的不完整数据集上的实验结果显示,SDBNB的分类准确率比分类效果较好的选择性不完整数据分类器SNB和SRBC平均高出0.69%和0.58%,而其标准离差比SNB和SRBC平均低0.11和0.05.这表明SDBNB不仅有较高的分类准确率,而且分类效果更稳定. 陈景年 黄厚宽 杨莉萍 田凤占关键词:数据分类 贝叶斯方法 不完整数据 缺失数据处理方法的比较研究 由于数据挖掘技术日益广泛地应用于各个领域,而大多数领域中数据都存在缺失值,因此基于缺失数据的数据挖掘方法的研究具有重要意义.利用直接删除、特殊值填充、平均值填充、Robust方法4种处理缺失值的方法建立4个缺失值处理模型... 乔珠峰 田凤占 黄厚宽 陈景年关键词:数据挖掘 缺失值 朴素贝叶斯分类器 ROBUST 缺失数据处理 文献传递 贝叶斯网络方法研究 贝叶斯网络是一种建立在概率和统计理论基础上的数据分析和辅助决策工具,以其坚实的理论基础、自然的表示方式、灵活的推理能力和方便的决策机制受到越来越多研究学者的重视.目前,贝叶斯网络已经广泛应用于数据挖掘、医疗诊断、工业控制... 田凤占关键词:贝叶斯网络 动态贝叶斯网络 EM算法 进化算法 缺失数据处理方法的比较研究 被引量:14 2006年 由于数据挖掘技术日益广泛地应用于各个领域,而大多数领域中数据都存在缺失值,因此基于缺失数据的数据挖掘方法的研究具有重要意义.利用直接删除、特殊值填充、平均值填充、Robust方法4种处理缺失值的方法建立4个缺失值处理模型以及相应的朴素贝叶斯分类器模型.通过在5个实际数据集上进行实验比较,并采用五重交叉验证来检验这些模型的性能.结果表明,用这些模型处理缺失值构建的朴素贝叶斯分类器是有效的. 乔珠峰 田凤占 黄厚宽 陈景年关键词:数据挖掘 缺失值 朴素贝叶斯分类器 ROBUST 基于KL距离的TAN分类器判别性学习方法 分类是机器学习、数据挖掘和模式识别领域中的一个重要研究方向。Bayesian分类器建立在Bayes统计和Bayesian网络方法的基础上,是一种最优分类器模型。常见的贝叶斯分类器模型有NB(Naive Bayes)分类器... 冯奇 田凤占 黄厚宽关键词:分类器 数据挖掘 贝叶斯 文献传递 贝叶斯学习、贝叶斯网络与数据采掘 被引量:63 2000年 自从50~60年代贝叶斯学派形成后,关于贝叶斯分析的研究久盛不衰。早在80年代,贝叶斯网络就成功地应用于专家系统,成为表示不确定性专家知识和推理的一种流行方法。90年代以来,贝叶斯学习一直是机器学习研究的重要方向。 林士敏 田凤占 陆玉昌关键词:贝叶斯学习 贝叶斯网络 数据采掘 用于数据采掘的贝叶斯分类器研究 被引量:44 2000年 所谓分类器是一个函数f(x),它给需要分类的实例x赋予类标签c,∈C(j=1,2,…,m),实例x由一组属性值a_1,…,a_n描述,C是类变量,取有限个值,可看成有限个元素的集合。进行分类首先要构造一个分类器。从预先分类的实例进行有导师学习并建立分类器,是机器学习的中心问题之一。已有的分类器如决策树、决策表、神经网络、决策图和规则等。 林士敏 田凤占 陆玉昌关键词:数据采掘 数据库 贝叶斯分类器