山西省高等学校高新技术产业化项目(20121011)
- 作品数:1 被引量:0H指数:0
- 相关作者:赵旭俊马洋更多>>
- 相关机构:太原科技大学更多>>
- 发文基金:山西省高等学校高新技术产业化项目山西省青年科技研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于链表结构的频繁模式树构造
- 2013年
- FP-Growth算法在关联规则挖掘中是最经典的算法,主要通过频繁模式树(FP树)避免生成候选频繁项目集。针对FP-Growth算法中耗费内存严重的问题,采用链表存储方式,给出了FP-Growth算法的实现方法,其中单个结点采用链表形式来产生,频繁模式树采用左孩子右兄弟的存储结构来组织。在此基础上利用索引表,实现了对频繁模式树中共同前缀结点的快速查找,提高了频繁模式树构造的效率,解决了FP树构造算法中数据存储的瓶颈问题。最后以天体光谱数据和城市土壤数据作为数据集分别对该算法进行测试,实验结果表明,该方法的构造效率要明显优于基于顺序结构的FP-Growth算法。
- 马洋赵旭俊
- 关键词:关联规则链表结构索引表光谱数据