刘马金
- 作品数:5 被引量:4H指数:1
- 供职机构:复旦大学计算机科学技术学院更多>>
- 发文基金:国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于计数的数据流频繁项挖掘算法
- 挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差。SRoEC,SReEC和RFreq算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应...
- 祝然威王鹏刘马金
- 关键词:数据挖掘
- 一种轮转的数据流频繁项挖掘算法
- 挖掘数据流的频繁项已受到广泛关注,研究者们提出了一些高效的数据流上挖掘频繁项的算法,尽管这些算法能够比较好地找到频繁项,但对频繁项支持度的估计往往存在较大误差。而新的算法REC除了能够保证频率超过一定阈值的数据项都能被找...
- 刘马金王鹏汪卫
- 关键词:数据流频繁项
- 文献传递
- 数据流频繁项挖掘算法
- 挖掘数据流的频繁项已受到广泛关注,研究者们提出了一些高效的数据流上挖掘频繁项的算法,尽管这些算法能够比较好的找到频繁项,但对频繁项频数的估计往往存在较大误差。而我们提出的三个算法:RFreq、SRoEC和SReEC,不仅...
- 刘马金
- 关键词:频繁项数据流
- 文献传递
- 一种轮转的数据流频繁项挖掘算法
- 挖掘数据流的频繁项已受到广泛关注,研究者们提出了一些高效的数据流上挖掘频繁项的算法,尽管这些算法能够比较好地找到频繁项,但对频繁项支持度的估计往往存在较大误差.而新的算法REC(rotative efficient co...
- 刘马金王鹏汪卫
- 关键词:频繁项数据流数据挖掘
- 文献传递
- 基于计数的数据流频繁项挖掘算法被引量:4
- 2011年
- 挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差.SRoEC(segment rotative efficient count),SReEC(segment reserve efficient count)和RFreq(reserve frequent)算法针对该问题,继承基于计数的算法思想,将计数器进行划分并定义相应的操作,以期提高频数统计准确度并减小"噪音"影响.实验和数据分析表明,这些算法不仅能够保证频数超过阈值的数据项都能被找到,而且大大提高了频繁项频数统计的准确性.在同样空间代价下,算法无论在模拟数据集和真实数据集实验中,都表现出较高的频数准确率、较低的频数偏差率和较高的频数保有率,尤其是数据分布较平缓时,算法优势更加明显.
- 祝然威王鹏刘马金
- 关键词:频繁项数据流数据挖掘