易磊
- 作品数:3 被引量:6H指数:2
- 供职机构:中国人民解放军理工大学更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 在线学习的大规模网络流量分类研究被引量:3
- 2016年
- 传统的批处理机器学习方法在面对大规模网络流量分类问题时存在分类器训练速度慢、计算复杂度高的缺陷。近年来迅速发展的在线学习方法是解决大规模问题的有效途径。本文针对高速骨干网上的大规模网络流量分类问题,提出了一个基于在线学习的分类框架,并应用了8种在线学习算法。在真实数据集上的实验表明,在分类精度相当的情况下,在线学习算法与支持向量机(SVM)相比空间开销小、模型训练时间显著缩短。同时,为了考察网络流量中样本顺序对分类效果的影响,本文对比了样本按时序处理与随机处理两种方式的差异,验证了网络流量样本存在着时序上的相关性。
- 易磊潘志松邱俊洋薛胶任会峰
- 关键词:网络流量分类数据流
- 一种利用Screening加速技巧的Lasso算法
- 2018年
- Lasso(Least absolute shrinkage and selection operator)是目前广为应用的一种稀疏特征选择算法。经典的Lasso算法通过对高维数据进行特征选择一定程度上降低了计算开销,然而,求解Lasso问题目前仍面临诸多困难与挑战,例如当特征维数和样本数量非常大时,甚至无法将数据矩阵加载到主存储器中。为了应对这一挑战,Screening加速技巧成为近年来研究的热点。Screening可以在问题优化求解之前将稀疏优化结果中系数必然为0的无效特征筛选出来并剔除,从而极大地降低数据维度,在不损失问题求解精度的前提下,加速稀疏优化问题的求解速度。首先推导了Lasso的对偶问题,根据对偶问题的特性得出基于对偶多面投影的Screening加速技巧,最后将Screening加速技巧引入Lasso特征选择算法,并在多个高维数据集上进行实验,通过加速比、识别率以及算法运行时间三个指标验证了Screening加速技巧在Lasso算法上的良好性能。
- 邱俊洋潘志松易磊陶蔚张梁梁
- 关键词:高维数据
- 在线多任务学习的骨干网网络流量分类研究被引量:3
- 2018年
- 网络流量分类是机器学习与网络安全领域中的一个研究热点.针对高速骨干网上网络流量的高速性与演化特性,基于在线稀疏学习算法FTPRL,提出一种在线多任务特征选择学习算法-MT-FTPRL.使用了Per-Coordinate学习率,对每个特征的学习率分别考虑,与全局学习率相比更具优势;提出一个在线多任务学习的网络流量分类框架,通过多个网络流之间的信息共享,提取一组拥有良好判别能力的共同特征子集;在实验部分构造了一个基于真实的骨干网网络流量的MAWI数据集,并通过对比实验对提出的算法及分类框架进行验证.实验表明,算法有着满意的分类准确性和检测效率,且能在多个网络流中提取一组共同的特征子集,提高分类系统的鲁棒性,更适应网络流量动态演化的特点.
- 易磊潘志松陶蔚杨海民
- 关键词:多任务学习骨干网网络流量分类