安徽省自然科学基金(050420207)
- 作品数:54 被引量:230H指数:10
- 相关作者:胡学钢田卫东王德兴张玉红郭有强更多>>
- 相关机构:合肥工业大学蚌埠学院安徽水利水电职业技术学院更多>>
- 发文基金:安徽省自然科学基金国家自然科学基金安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术水利工程天文地球理学更多>>
- 基于多重多层次关系的分类属性泛化研究被引量:2
- 2008年
- 文章针对具有多重多层次的属性泛化问题构建了MRML泛化模型,并应用于分类规则的学习,提出一种基于MRML泛化关系的分类规则泛化学习方法(CG-DK);该方法根据具体发现任务的需求和当前实际数据库的内容,通过误分类率的控制,在挖掘的过程中选择最紧凑的泛化层次和路径对属性进行泛化,以得到符合用户个性化要求的优化的分类规则;实验表明了该方法的有效性。
- 胡学钢周循张晶张润梅
- 关键词:数据挖掘
- 基于多剪枝格的频繁项集表示与挖掘
- 2007年
- 文章在研究基于剪枝概念格的频繁项集表示的基础上,提出了基于多剪枝概念格模型的频繁项集表示与挖掘方法。该方法在多剪枝格基础上进行导出频繁项集的合并,进而获得全局频繁项集,有效地降低了频繁项集表示的规模;理论分析和实验结果表明,该方法能获得满足用户要求的近似所有全局频繁项集。
- 胡学钢徐勇王德兴张晶
- 关键词:数据挖掘频繁项集
- 一种基于主动贝叶斯分类技术的垃圾邮件过滤方法被引量:1
- 2008年
- 目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点。对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性。
- 李笛张玉红胡学钢
- 关键词:垃圾邮件文本分类信息过滤贝叶斯分类
- 一种具有缺失数据的贝叶斯网络结构学习方法被引量:7
- 2007年
- 在数据缺失的情况下,文章建立的贝叶斯网络结构学习方法BC-ISOR基于界定折叠方法进行变量集联合概率的估计,基于依赖分析的基本思想进行贝叶斯网络的结构学习。该方法的概率估计与数据的缺失率无关,并有效降低了条件独立性检验的次数和阶数,因而具有良好的学习效率并能避免陷入局部最优;针对Asia网络的实验结果表明,该方法比经典方法SEM具有更好地时效性和精确性。
- 胡春玲胡学钢
- 关键词:贝叶斯网络缺失数据
- 基于主成分分析和模糊聚类的水文分区被引量:13
- 2009年
- 水文分区有各种方法,文章提出了集模糊聚类与主成分分析方法的各优点组合的水文分区方法,首先采用主成分分析法获得水文特性主成分属性,然后运用模糊聚类算法NFC(Net Fuzzy Cluster)进行模糊聚类。利用主成分分析法对分区指标进行降维处理,简化了计算。应用NFC模糊聚类,在一定程度上解决了FCM算法局部极值问题且具有良好的聚类性能,实现了聚类的科学化与自动化。对安徽省淮河流域的124716个原始水文数据进行实验,结果表明,与传统分区方法相比,所提出的方法有效地改善了时间性能,提高了求解精度,所得结果为水文站网规划提供了理论依据。
- 丁亚明赵艳平张志红胡学钢
- 关键词:主成分分析水文分区
- 基于VPRS的近似概念格模型及其构造
- 不确定知识的提取是机器学习和数据挖掘领域一个重要的研究课题。概念格是一种精确的、有效的知识发现模型,难以处理用户感兴趣的不确定知识。VPRS 模型是处理不确定知识的一种有效工具。本文将 VPRS 引入概念格,提出一种近似...
- 张玉红胡学钢刘晓平
- 关键词:概念格不确定信息
- 文献传递
- 基于可疑实例影响度分析改进的C4.5 rules算法被引量:1
- 2007年
- 决策树学习算法是数据挖掘中一类经典的分类算法。传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量。在此提出基于可疑实例影响度分析改进的C4.5 rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测。算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果。将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能。
- 王强胡学钢
- 关键词:数据挖掘决策树
- 一种基于随机抽样的贝叶斯网络结构学习算法被引量:2
- 2009年
- 针对贝叶斯网络的结构学习问题,基于并行随机抽样的思想提出了结构学习算法PCMHS,构建多条并行的收敛于Boltzmann分布的马尔可夫链。首先基于节点之间的互信息,进行所有马尔可夫链的初始化,在其迭代过程中,基于并行的MHS抽样总体得到产生下一代个体的建议分布,并通过对网络中弧和子结构的抽样产生下一代个体。算法PCMHS收敛于平稳分布,具有良好的学习精度,而该算法又通过使其初始分布和建议分布近似于其平稳分布,有效提高了马尔可夫链的收敛速度。在标准数据集上的实验结果验证了算法PCMHS的学习效率和学习精度明显优于经典算法MHS和PopMCMC。
- 胡春玲胡学钢
- 关键词:贝叶斯网络马尔可夫链
- 负增量关联规则更新算法研究
- 2007年
- 在增量式关联规则更新算法的研究中,关于负增量式更新算法的研究比较少。提出了一种实用的在支持度和置信度不变的情况下数据集规模减小的负增量关联规则更新算法。算法在如何减少数据集的扫描次数,如何充分利用现有的信息减少候选集的规模等方面进行了研究,给出了算法的具体实现。通过分析,算法是可行的。
- 郭有强胡学钢
- 关键词:关联规则增量更新算法剪枝
- Web挖掘中发现用户访问模式算法的改进与分析被引量:2
- 2005年
- Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了有价值的潜在信息。本文提出了一种改进算法——RD_Close。该算法对数据挖掘中的Close方法进行了改进,并引入了RD_Apriori方法中缩减数据库的思想。这种改进算法能有效发现用户频繁访问模式。最后,用实际数据对算法性能进行了充分验证和深入分析。
- 欧阳一鸣陈敏刘红樱胡学钢
- 关键词:WEB挖掘频繁访问模式