国家自然科学基金(60863001) 作品数:12 被引量:77 H指数:4 相关作者: 李玲娟 李冰 张春元 宋春晖 雷景生 更多>> 相关机构: 海南大学 南京邮电大学 海南师范大学 更多>> 发文基金: 国家自然科学基金 海南省自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
K-MEANS算法在IDS中的应用研究 被引量:3 2010年 聚类算法广泛应用于入侵检测系统(IDS)的数据挖掘中。虽然K-MEANS算法是最为经典的聚类算法之一,但是由于入侵检测系统的数据集具有特殊性,直接在其上进行K-MEANS聚类的效果不佳。为了提高K-MEANS在IDS数据集上的聚类准确性,引入一种数据预处理方法。该方法对IDS的记录特征做标准化处理,使原本取值范围差异很大的数值型特征在同一个区间内取值,排除原始数据中不同度量带来的不良影响,从而优化聚类的效果。仿真实验表明,K-MEANS算法对预处理后的IDS数据集的聚类准确度有很大的提高。 李玲娟 李冰 薛明关键词:数据挖掘 入侵检测系统 K均值聚类 预处理 一种基于交通路网的移动对象索引结构 2010年 以提高移动对象数据库中交通道路上的移动对象位置查询效率为目标,通过借鉴FNR-tree的思想并加以改进和综合运用hash表、动态数组、B树、单循环链表,设计了一种新的基于交通路网的移动对象索引结构(Dynamic and Efficient Index,DEI),并给出了操作算法。DEI索引结构由道路hash部分、时间信息结构和移动对象hash结构3部分组成。DEI支持对移动对象的过去、现在和将来位置的有效查询,可实现移动对象的快速定位。仿真实验结果验证了DEI的性能优势。 李玲娟 王翠香 韩京宇关键词:索引 交通道路 B树 哈希表 视频镜头边界检测中奇异值分解算法 2009年 在海量的视频数据中准确、快速地检测出镜头边界非常重要。对这一问题,基于现有的视频镜头边界检测方法的基础上,提出基于奇异值分解的视频镜头边界检测方法。实验结果显示,该算法是有效的,其不但能准确地检测出突变边界而且对渐变边界检测也有较好的效果,并且在新闻视频中可有效识别闪光。 吴淑雷 陈焕东 宋春晖 王红晨关键词:视频 奇异值分解 基于超链接和相关度策略的克隆Web搜索方法 2009年 针对如何快速有效地搜索用户所需要的Web资源问题,在介绍HITS算法的基础上,分析其产生主题漂移的原因,并结合内容相关度策略,提出一种新的CSHITS搜索算法,该算法通过克隆、变异和交叉操作获取具有相关度高的Web页面。实验结果表明,CSHITS算法挖掘了超链接间的潜在语义关系,能有效地引导主题挖掘。 严丽丽 陈鹤年 季文天 雷景生关键词:链接分析 HITS算法 克隆选择算法 云计算环境下关联规则挖掘算法的研究 被引量:50 2011年 云计算为存储和分析海量数据提供了廉价高效的解决方案,云计算环境下的数据挖掘算法的研究具有重要的理论意义和应用价值。针对云计算环境下的关联规则挖掘算法展开研究,介绍了云计算的概念、Hadoop框架平台、MapReduce编程模型和传统的Apriori算法;在此基础上,以实现云计算环境下的并行化数据挖掘为目的,对Apriori算法进行了改进,给出了改进的算法在Hadoop中的MapReduce编程模型上的执行流程;通过一个简单的频繁项集挖掘实例展示了改进的算法的执行效率及实用性。 李玲娟 张敏关键词:云计算 数据挖掘 APRIORI MAPREDUCE 基于CRFs的新闻网页主题内容自动抽取方法 被引量:1 2011年 针对当前新闻网页主题内容抽取方法较少利用网页块之间关联特性这一问题,提出了一种基于条件随机场(CRFs)的新闻网页主题内容自动抽取方法。该方法首先将待抽取网页解析成DOM树,经过滤、剪枝以及压缩处理后,然后按照一定的启发式规则将DOM树切割成块并转换成为一个数据序列,再定义CRFs特征函数来提取各网页块自身状态特征和相邻块间类别转移特征,通过CRFs模型对数据序列进行类别标注来实现网页主题内容的抽取。实验表明,该方法对新闻网页主题内容的抽取具有较高检准率和较强适应能力,引入块间关联特性可改善新闻网页主题内容的抽取。 张春元关键词:WEB信息抽取 条件随机场 网页分块 一种新的基于Dewey编码的XML路径索引 被引量:2 2010年 建立高效的索引来快速定位满足要求的节点是提高XML数据查询效率的一个必要手段。文中以降低复杂度和提高查询效率为目标,以基于路径的XML索引原理为基础,提出了一种新型的基于Dewey编码的索引结构RTL-Index。RTL-Index通过对文档节点编码来表示结构信息,利用前缀路径匹配操作完成结构查询,支持含通配符"*"和后代轴"//"的查询以及兄弟节点无序的模式树的查询。仿真实验结果表明RTL-Index索引具有较低的时间和空间复杂度,解决了XML文档分支路径查找问题,是一种较为有效的XML索引结构。 李玲娟 倪铖 韩京宇关键词:XML 查询处理 DEWEY编码 索引 一种基于特征加权的蚁群聚类新算法 被引量:9 2010年 蚁群聚类算法作为一种群体智能的算法已经被证实可用于高维数据的聚类,能够快速有效地处理Web的海量、高维数据,但是传统的蚁群聚类算法并未考虑各维特征的贡献率,聚类的准确度有限。文中以优化聚类效果为目标,提出了一种基于特征加权的蚁群聚类新算法FWACCA,在新算法中考虑了各维特征对分类贡献的多少,合理地使用了Sigmoid概率转换函数和主客观结合的赋权法。实验结果表明此新算法可以有效减少聚类出错率,提高聚类的准确性。 李玲娟 李冰关键词:蚁群聚类 特征加权 基于本体的信息过滤需求模型构造 被引量:5 2008年 在信息过滤系统中,由于缺乏语义模型作为支撑,基于关键词的用户需求模型难于准确地反映出用户的真实需求,成为影响过滤性能的主要瓶颈。提出了以本体构造用户需求模型的方法:采用领域相关度和领域一致度组合方法来确定查询关键词在特定领域的重要程度,建立查询关键词到本体概念的映射,然后利用本体的概念及属性构造用户需求模型。这种基于本体的用户需求模型构造方法能提高过滤系统性能。 宋春晖 雷景生 赵思轩关键词:信息过滤 本体 本体学习 流媒体连续性与实时性的有效平衡机制 被引量:1 2012年 播放的连续性和实时性是交互式流媒体应用的重要QoS需求,需要在连续性和实时性之间取得一个平衡,为此,本文提出一种有效的平衡算法PBB。算法PBB是一种基于缓存动态可调的机制,为每个接收主机引入一个大小可调的缓存,通过缓存的引入来达到减小延迟抖动的目的;另外,为了避免产生不可接受的端到端延迟,由一个指定的控制器根据当前的网络形势来动态调整缓存大小,并通过模拟实验将PBB算法与经典算法比较,结果表明PBB算法可以在流媒体播放的连续性和实时性之间获得较好的平衡。 孙盛杰 廖宇力 虞衍聪关键词:流媒体 QOS 连续性 实时性