戴南 作品数:5 被引量:35 H指数:2 供职机构: 南京师范大学数学科学学院 更多>> 发文基金: 江苏省教育厅自然科学基金 江苏省重点实验室开放基金 更多>> 相关领域: 自动化与计算机技术 更多>>
赛马矩阵问题及其解法 被引量:1 2002年 本文命名了赛马矩阵问题 ,并利用笔者提出的公式化方法和伴随序列法解决了此问题 . 戴南 朱玉龙关键词:计算机 基于决策树的分类方法研究 该文研究如何用决策树方法进行分类模式挖掘.文中详细阐述了几种极具代表性的决策树算法:包括使用信息熵原理分割样本集的ID3算法;可以处理连续属性和属性值空缺样本的C4.5算法;依据GINI系数寻找最佳分割并生成二叉决策树的... 戴南关键词:数据挖掘分类 决策树 分布式数据挖掘 文献传递 分布式数据挖掘原型系统DDMINER 吉根林 杨明 孙志挥 赵斌 韦素云 戴南 曲维光 陈冬霞 系统基于全局—局部站点模式的分布式环境,针对提高分布式数据挖掘效率的关键技术,提出频繁项目集分布式挖掘与更新算法GFM、约束性频繁项目集分布式挖掘与更新算法DCAR等,为分布式关联规则挖掘提供了新思路和新方法。提出了基于...关键词:关键词:数据挖掘 分布式系统 关联规则 分布式决策树算法研究与实现 被引量:3 2005年 提出了一种基于分布多库环境下的决策树生成算法DDTA(D istributed D ecision Tree A lgorithm).该算法使用基于信息熵增益的思想分割各个分布的、同构训练样本集,各分布站点利用服务器传来的分割属性分割自己的样本集,服务器则通过对所有分布站点传来的信息计算各个属性的信息熵增益得到分割属性.实验表明DDTA算法能对分布同构样本集进行有效决策树挖掘,分布多库环境下生成的决策树是正确的.与算法INDUS相比,该算法的通信代价小. 戴南 吉根林关键词:决策树 一种基于信息熵的可伸缩决策树算法 被引量:1 2005年 提出了一种基于信息熵的可伸缩决策树生成算法 SDTA(A Scalable Decision Tree Algorithm)。与 SPRINT 算法不同,该算法使用基于信息熵增益的思想分割训练样本集,引入了新的数据结构:基于类别的属性表。该表记录存储了计算分割属性的所有信息,并且该表的大小不会随样本集的增大而增大,可以常贮主存。与 SLIQ 算法相比,SDTA 算法彻底摆脱了主存容量对算法效率的限制。实验表明,SDTA 算法能生成正确的决策树,而且具有良好的可伸缩性。 戴南 郑爱彬关键词:决策树 可伸缩