张盼盼
- 作品数:3 被引量:5H指数:2
- 供职机构:天津工业大学计算机科学与软件学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于概念重复性的数据流集成分类算法被引量:2
- 2016年
- 目前关于概念漂移数据流的分类研究已经取得了许多成果,但大部分没有充分考虑到数据流中概念重复出现的情况,这将耗费大量的计算和内存资源,增加了分类错误的可能性。为此,基于概念的重复性提出了一种数据流集成分类算法,该算法运用集成分类思想处理数据流中的概念漂移,但在学习过程中不会将暂时失效的概念及对应基分类器删除,而是把它们的基本信息存储起来,方便以后调用,并可根据概念间的转换关系预测即将到来的概念,在提高分类精度的同时又提高了时间效率。实验结果验证了算法的有效性。
- 尹绍宏张盼盼
- 关键词:数据挖掘数据流概念漂移
- 隐含概念漂移的不确定数据流集成分类算法被引量:3
- 2016年
- 近年来,数据流分类问题已经逐渐成为数据挖掘领域的一个研究热点,然而传统的数据流分类算法大多只能处理数据项已知并且为精确值的数据流,无法有效地应用于现实应用中普遍存在的不确定数据流。为建立适应数据不确定性的分类模型,提高不确定数据流分类准确率,提出一种针对不确定数据流的集成分类算法,该算法将不确定数据用区间及其概率分布函数表示,用C4.5决策树分类方法和朴素贝叶斯分类方法训练基分类器,在合理处理数据流中不确定性的同时,还能有效解决数据流中隐含的概念漂移问题。实验结果表明,所提算法在处理不确定数据流的分类时具有较好的鲁棒性,并且具有较高的分类准确率。
- 张盼盼尹绍宏
- 关键词:不确定数据流概念漂移数据挖掘
- 面向概念漂移数据流的分类算法研究
- 在信息通信技术如此发达的今天,气象监控、网络安全、电子商务等众多应用领域都产生了庞大的数据流,这些数据流中蕴含着大量有价值的信息,而传统的静态数据挖掘技术已无法适应高速、连续、无限、多变的数据流,研究适合、高效的数据流挖...
- 张盼盼
- 关键词:鲁棒性能准确率