何艳珊
- 作品数:3 被引量:9H指数:2
- 供职机构:兰州大学信息科学与工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SVM的多变量股市时间序列预测研究被引量:6
- 2010年
- 目前在股市时间序列预测中,大多数采用单变量时间序列预测算法,导致预测准确度不够高。提出采用基于支持向量机SVM(Support Vector Machines)的多变量股市时间序列预测算法,来提高预测准确度。SVM训练算法中,合适的参数可以使训练模型具有更好泛化能力。交叉验证具有指导参数选择的能力,然而考虑到交叉验证算法效率不高的问题,将其并行化,既达到了参数优选的目的,又避免了传统交叉验证效率低的问题。然后,根据较优参数建立多变量SVM时间序列回归预测模型,进行预测。实验证明,预测平均绝对百分比误差控制在10%以内,并且较之单变量的SVM回归预测有更好的泛化能力。
- 金桃岳敏穆进超宋伟国何艳珊陈毅
- 关键词:支持向量机多变量
- 并行化频繁项集挖掘及其在数据流中的研究
- 频繁模式挖掘是数据挖掘中的一项重要任务,通过挖掘频繁模式,我们可以发现隐藏在数据中的有趣的相关和关联。频繁项集的挖掘作为频繁模式挖掘中的一类,它可以广泛应用在关联规则挖掘、聚类、分类和预测、入侵检测、相关性分析等等许多种...
- 何艳珊
- 关键词:频繁项集挖掘高性能并行化数据流
- 文献传递
- 一种简单有效的并行化频繁项集挖掘算法被引量:2
- 2010年
- 频繁项集挖掘,作为数据挖掘的一项基本任务,自提出以来就受到计算机科学理论研究的广泛重视。当前很多数据挖掘算法在处理大型数据集时的运行时间无法预计并且不可接受,这也是当前频繁项集挖掘领域遇到的一个主要挑战。本文提出一种简单有效的并行化频繁项集挖掘算法-SP-FP-Growth算法,此算法可以有效的挖掘频繁项集,并通过极少的节点间通讯和负载平衡策略保证了并行环境的高效性。实验结果证明,SP-FP-Growth算法具有良好的时间效率和可伸缩性。
- 金桃何艳珊宋伟国岳敏
- 关键词:频繁项集并行化负载平衡