丁勇 作品数:32 被引量:92 H指数:6 供职机构: 南京理工大学泰州科技学院 更多>> 发文基金: 国家自然科学基金 江苏省高校自然科学研究项目 江苏省高等教育教改立项研究课题 更多>> 相关领域: 自动化与计算机技术 文化科学 交通运输工程 医药卫生 更多>>
一种基于Hadoop的关联规则挖掘算法 被引量:7 2018年 传统的并行关联规则算法对每一次迭代都定义一个MapReduce任务,以实现候选项集的生成和计数功能,但多次启动MapReduce任务会带来极大的性能开销。文中定义了一种并行关联规则挖掘算法PST-Apriori,该算法采取分治策略,在每个分布式计算节点定义一个前缀共享树,通过递归调用的方式将事务T生成的候选项集逐层压缩到前缀共享树(PST)中。然后广度遍历PST,逐层将每个节点对应的〈key,value〉作为map函数的输入,并由MapReduce框架自动按照key值进行聚集。最后调用reduce函数对多个任务的处理结果进行汇总,得到满足最小支持度阈值的频繁项集。算法只使用两个MapReduce任务,且PST按照key值排序便于Mapper端的shuffle操作,提高了运行效率。 丁勇 朱长水 武玉艳关键词:关联规则 HADOOP MAPREDUCE 基于非欧式距离的模糊核聚类算法在入侵检测的应用 被引量:1 2014年 模糊核C-均值聚类(KFCM)的主要思想是在模糊C-均值聚类(FCM)中引入核函数,样本点被非线性变换映射到高维特征空间进行聚类,解决了高维数据空间的聚类问题。同经典的FCM算法及其派生算法一样,KFCM算法对噪声或野值数据敏感。论文在KFCM基础上,利用鲁棒统计观点对目标函数进行改进,通过引入非欧式距离度量代替欧氏距离度量,提高其对噪声或野值数据的抗干扰能力。将该算法用于构建入侵检测系统模型并通过模拟仿真实验表明,改进算法有效解决了传统的聚类算法在入侵检测中稳定性差,检测准确率低的问题。 李丛 王云 胡文军 丁勇关键词:KFCM 入侵检测 事件序列上的频繁情节挖掘算法 2014年 事件序列上的频繁情节挖掘是时序数据挖掘领域的热点之一,基于非重叠发生的支持度定义,提出一个频繁情节挖掘算法NONEPI++,该算法首先通过情节串接产生候选情节,然后通过预剪枝和计算情节发生的时间戳来产生频繁情节.算法只需扫描事件序列一次,大大提高了情节挖掘的效率.实验证明,NONEPI++算法能有效地挖掘频繁情节. 丁勇 王云 李丛关键词:频繁情节 遗传算法在公交调度中的应用 被引量:10 2016年 针对泰州市公交智能化建设方面存在的技术问题,提出将遗传算法(Genetic Algorithms,GA)应用到公交调度优化中。以公交公司和乘客费用最少、社会效益最大为目标函数建立公交调度优化的数学模型,并应用遗传算法实现对模型的求解,通过对模型设置不同的参数,利用Matlab模拟实验验证模型的合理性、科学性。实验证明,优化的调度模型可降低公交公司的运营成本,提高乘客的满意度,确保社会效益和经济效益得到最大满足。 丁勇 姜枫 武玉艳关键词:遗传算法 公交调度 MATLAB 入侵检测中基于IBQGSA的特征选择及SVM参数优化 被引量:2 2017年 针对支持向量机(SVM)应用于网络入侵检测时特征选择及分类器参数优化问题,利用改进的二进制量子引力搜索算法(IBQGSA)对入侵特征集及SVM参数进行组合寻优。将入侵特征集及SVM参数看作是二进制量子引力搜索算法中的量子个体并进行组合编码,在使用量子旋转门更新个体位移时,引入动态的位移更新策略,确保算法收敛到全局极值,设计与进化程度及个体适应度值相关的自适应变异概率,提升量子非门变异操作时算法的自适应变异能力。利用KDD CUP 99数据集进行仿真实验,实验结果表明,所提算法能有效地获取最佳特征子集及分类器参数组合,检测效果更好。 李丛 闫仁武 丁勇 王云关键词:支持向量机 参数优化 入侵检测 浅谈应用型本科《C程序设计》教学改革 2019年 《C程序设计》是一门注重实践性与应用性的学科,教学根本目标在于培养应用型和创新型人才。文章在分析本课程教学现状的基础上,分别从激发学生兴趣、启发式教学、任务驱动法教学、改革评价方式等方面论述了本课程的改革方向。 朱长水 丁勇关键词:程序设计 基于前缀共享树的频繁情节挖掘算法 2014年 经典的频繁情节挖掘算法NONEPI及其改进算法NONEPI+存在时空复杂度高、"重复计算"等问题,基于最小且非重叠发生的支持度定义,提出一个基于前缀共享树的频繁情节挖掘算法PST_NONEPI,该算法采用深度优先搜索策略,将发现的频繁情节压缩到前缀共享树中,通过动态维护前缀共享树来发现所有的频繁情节。该算法只需扫描事件序列一次,大大提高了频繁情节挖掘的效率。实验证明,PST_NONEPI算法能有效地挖掘频繁情节。 丁勇 朱辉生 高广银关键词:频繁情节 便携式图像识别装置 本实用新型公开了便携式图像识别装置,包括图像识别装置主体和保护套,所述图像识别装置主体的表面位于保护套的内腔,所述保护套的表面设置有防摔层,所述防摔层远离保护套的一侧设置有防磨层。本实用新型通过设置图像识别装置主体、保护... 周莉莉 姜枫 丁勇文献传递 改进的频繁闭情节挖掘算法 2014年 为克服FCMMiner算法在挖掘频繁闭情节时存在的不足,基于最小且非重叠发生的支持度定义,提出一种事件序列上频繁闭情节挖掘算法FCM++。定义两种特殊的数据结构:频繁情节树(FET)、层头表(LH),采用广度优先搜索策略进行层扩展操作,扩展时将挖掘的频繁情节逐层压缩到FET和LH结点链中。通过动态维护FET及闭合性检查过程挖掘所有的频繁闭情节。实验结果表明,FCM++算法较FCMMiner算法有更高的挖掘效率,能有效地挖掘所有的频繁闭情节。 丁勇 朱辉生 高广银关键词:频繁情节 频繁闭项集 基于混合EHMM模型的数据流预测 被引量:1 2014年 首先提出一种改进的算法NONEPI++,用于挖掘事件序列上非重叠发生的频繁情节;然后将每个频繁情节表示为相应的情节隐马尔可夫模型EHMM,并通过最大期望算法计算模型的混合系数,从而生成一个基于历史数据流的混合模型;最后,基于该混合模型预测目标事件类型出现的概率。实验表明,混合EHMM模型能有效地预测数据流。 丁勇 朱辉生 曹红根关键词:频繁情节 隐马尔可夫模型