搜索到897篇“ 频繁序列模式“的相关文章
基于频繁序列模式的私家车出行热点路径挖掘方法
本发明公开了一种基于频繁序列模式的私家车出行热点路径挖掘方法,包括以下步骤:步骤S1:将私家车出行链序列化;步骤S2:在PrefixSpan算法的基础上,定义了RFID阅读器后继集合来加快数据挖掘;步骤S3:结合由经过相...
郑林江吕俊超孙棣华赵敏
本地化差分隐私下的频繁序列模式挖掘算法PrivSPM被引量:2
2023年
序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。
黄硕李艳辉曹建秋
关键词:隐私保护数据挖掘
基于频繁序列模式挖掘的卡口短时交通量预测
2023年
基于数据的城市交通管理和控制方法是广大学者和交通管理部门的关注重点。以频繁序列模式挖掘算法为基础,对卡口车辆轨迹序列进行时空特征分析。选用7种典型的机器学习算法进行预测,并分析了卡口空间区位、交通量以及连接道路等级对预测精度的影响。研究结果表明,集成学习算法特别是RF的预测性能最好,误差较小且训练速度快;SVR和神经网络算法(MLP、LSTM)在预测误差表现上相近,但是基于神经网络算法的预测模型耗时较长。此外,不同模型的预测误差在空间上的分布具有相似性,在卡口密布的区域预测精度更高,在外围边缘区域误差较大;卡口交通量越大、连接的道路等级越高,预测精度越高。随着城市交通电子卡口设备在路网中的完善,该预测方法的准确性可以进一步提高。
刘冉李岩毛海虓钱剑培王继峰马悦
关键词:短时交通流量预测
一种基于分布式日志的最大频繁序列模式挖掘方法
本发明涉及一种基于分布式日志的最大频繁序列模式挖掘方法,基于Spark分布式计算框架,提取局部最大频繁序列;利用前缀投影来划分搜索空间,递归提取出局部最大频繁序列;其中,利用频繁1序列删除日志序列数据集里面非频繁项,降低...
肖如良陈雄蔡声镇陈黎飞许力倪友聪
一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法
本发明公开了一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,包括步骤:对商品交易数据进行预处理,得到商品交易数据集,并存入交易序列数据库中;扫描交易序列数据库,对每个单项进行计数,得到每个单项的序列支...
何新王子龙陈琛
基于支持向量机的Web日志频繁序列模式挖掘研究被引量:1
2021年
为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法。构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合。建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的自适应学习与寻优控制,实现Web日志频繁序列模式挖掘。仿真结果表明,采用该方法进行Web日志频繁序列模式挖掘的误差较低,收敛性较好。
陈宝国宋旸
关键词:支持向量机WEB日志
分布式车辆GPS轨迹频繁序列模式挖掘方法研究
随着GIS、移动互联网和物联网技术与城市智能交通系统的深度融合,大规模的轨迹数据得以被高效地采集、传输和存储。轨迹数据是在特定的时空环境下对移动对象的连续运动位置进行采样所获得的时间序列数据。城市路网中的轨迹数据中隐含了...
黄山
关键词:智能交通
无重叠自适应频繁序列模式挖掘方法
本发明涉及无重叠自适应频繁序列模式挖掘方法,属于数据挖掘的序列模式分析领域。该方法利用模式增长策略减少候选模式生成、通过深度优先策略构建单支网树来提高支持度计算效率,进而解决无重叠自适应频繁序列模式挖掘问题,该方法在不给...
王月华李艳王珠林刘锦赵晓倩陈明婕武优西
基于频繁序列模式的私家车出行热点路径挖掘方法
本发明公开了一种基于频繁序列模式的私家车出行热点路径挖掘方法,包括以下步骤:步骤S1:将私家车出行链序列化;步骤S2:在PrefixSpan算法的基础上,定义了RFID阅读器后继集合来加快数据挖掘;步骤S3:结合由经过相...
郑林江吕俊超孙棣华赵敏
一种从Web日志中挖掘攻击频繁序列模式的方法
本发明涉及网络安全领域的数据挖掘,具体涉及一种从Web日志中挖掘攻击频繁序列模式的方法。本发明的方法包括:收集网站访问日志文件,网页信息及攻击特征码;解析网站日志结构,将解析出的URL与收集到的攻击特征码进行匹配,得到攻...
孙建华孙慧

相关作者

但红卫
作品数:8被引量:24H指数:3
供职机构:浙江大学计算机科学与技术学院
研究主题:数据挖掘 频繁序列模式 知识粒度 隐私保护 WEB设计
徐春选
作品数:4被引量:2H指数:1
供职机构:北京联合大学平谷学院
研究主题:电子商务 频繁序列模式 WEB使用挖掘 电子商务网站 C语言教学
罗阳
作品数:3被引量:5H指数:1
供职机构:沈阳航空航天大学
研究主题:WEB挖掘 网页分类 频繁序列模式 支持向量机 基于WEB
程舒通
作品数:57被引量:515H指数:12
供职机构:杭州科技职业技术学院
研究主题:数据挖掘 职业教育 学分银行 计算机网络 诉求
徐从富
作品数:122被引量:981H指数:16
供职机构:浙江大学
研究主题:数据挖掘 垃圾短信 垃圾邮件过滤 隐私保护 数据融合