陈茵
- 作品数:3 被引量:6H指数:1
- 供职机构:北京航空航天大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 最小冗余的无损关联规则集表述被引量:5
- 2008年
- 传统关联规则挖掘得到的原始规则集包含大量的、杂乱的规则,其中很多是冗余的,这样的规则集难以被用户理解和应用.针对这一问题,探讨了原始规则集与规则集表述之间的关系,提出了一个新的规则集表述模型.该模型包含一个利用概率统计原理构建的推演系统,能够从原始规则集中去除冗余规则,得到无损的规则集表述.这种规则集表述比原始规则集更简洁、更易于理解以及更便于用户管理和应用.更重要的是,该模型得到的规则集表述是无损的,能够实现原始规则集和规则集表述之间的相互推演,保证了信息的完整性.在四个著名数据集上进行的实验表明,规则集表述中的规则数量显著减少.
- 陈茵闪四清刘鲁李岩
- 关键词:关联规则冗余规则
- 最小冗余的无损关联规则集表述及其应用
- 陈茵
- 关键词:数据挖掘关联规则冗余规则
- 采用映射哈希表的频繁模式挖掘方法被引量:1
- 2008年
- 大多数对频繁模式挖掘算法的研究都着眼于逻辑层面算法过程的改进,而对数据在计算机内存中的物理存储方式的探索相对较少。以FP-Tree存储结构和FP-Growth算法为基础,提出了FP-Tree头表的顺序存储方式,并在此基础上,利用基于频繁项ID映射的哈希表对FP-Tree的存储方式进行了改进,提出了与之相对应的频繁模式挖掘算法。实验结果表明该算法是快速和有效的。
- 陈茵闪四清
- 关键词:关联规则频繁模式树频繁模式增长哈希表映射