国家自然科学基金(61001178)
- 作品数:7 被引量:44H指数:4
- 相关作者:赖英旭杨震胡少龙王来涛范科峰更多>>
- 相关机构:北京工业大学桂林电子科技大学中国电子技术标准化研究所更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- Capturing Important Burst Features in News Streams
- In news streams,there are often several important events and many minor events.Affected by this phenomenon,rec...
- Gang Du
- 基于改进语义距离的网络评论聚类研究被引量:9
- 2014年
- 针对在线评论,提出了一种短文本语义距离计算模型,将文本距离看成是形式距离和单元语义距离的综合.首先,在对变异短文本进行预处理的基础上,以中文词语为单位,利用词典进行语义扩展,计算短文本间最大匹配距离,将其作为衡量短文本间形式距离的指标;其次,基于短文本中的实义单元和非实义单元的不同作用,利用改进的编辑距离算法计算短文本的单元语义距离;最后,利用加权的方法将形式距离和单元语义距离综合为文本距离,并将其应用于网络在线评论的聚类分析.特别地,为了缓解短文本长度差异所造成的计算误差,提出利用词表长度对距离进行惩罚,并根据Zipf’s Law和Heap’s Law的对应关系,给出了一种文本词表长度的估计方法,并阐明了文本Zipf指数α对长度惩罚的关键性作用机制.实验结果表明,改进算法优于传统方法,聚类性能显著提升.
- 杨震王来涛赖英旭
- 关键词:文本聚类语义距离
- 一种安全操作系统风险评估模型被引量:7
- 2011年
- 针对安全操作系统风险管理难以进行定量评判的问题,提出一种适用于安全操作系统风险等级定量评估的模型。通过引入风险矩阵法,将信息安全风险评估归纳为以专家矩阵、Borda法则和层次分析法为评估流程的风险等级评估模型,实现安全操作系统风险等级的定量评估,增强评估操作系统风险等级的客观性。通过实例应用对评估模型进行验证,结果表明该模型能有效评估出安全操作系统的风险等级。
- 邓平范科峰张素兵莫玮
- 关键词:安全操作系统风险评估层次分析法
- 改进贝叶斯算法在未知恶意软件识别中的研究被引量:3
- 2011年
- 为改进朴素贝叶斯(naive Bayes,NB)算法在识别未知恶意代码过程中学习速度慢的缺点,在分析研究朴素贝叶斯算法、复合贝叶斯(mu lti-naive Bayes,MNB)算法的基础上,提出了一种改进贝叶斯(half-increm entnaive Bayes,HNB)算法.算法采用特征集增量学习方式,在保证分类精度不降低的前提下,学习速度提高约30%.实际样本测试表明,分类精度达到了96%,其中对已知恶意代码的分类精度达到99%.
- 赖英旭杨震
- 关键词:分类器数据挖掘贝叶斯算法
- 基于尾项加权的自适应文本分类方法研究
- 2011年
- 基于朴素贝叶斯分类框架,通过添加尾项值对部分严重扭曲的分类结果进行调整,达到提升分类器性能的目的.方法通过增量式自适应学习分类模式,根据历史结果,判断分类器分类质量,进而确定尾项添加区间,对明显产生分类扭曲的区间结果自适应添加尾项补偿,调整分类结果.在Trec05,Trec06,Trec07,Ceas08数据集上的对比实验表明,改进算法在accuracy,Macro F1两个指标上均比朴素贝叶斯分类器和bagging朴素贝叶斯分类器显著提高,且方法简单易行.
- 赖英旭许昕杨震
- 关键词:文本分类朴素贝叶斯分类器垃圾邮件过滤
- Maximizing the Reliability of Two-state Automaton for Burst Feature Detection in News Streams
- <正>The capture of temporal dynamics of news streams has drawn increasing attentions in recent sequential data ...
- Gang Du~*
- 关键词:AUTOMATON
- 文献传递
- 基于LZW算法的未知恶意代码检测方法
- 2012年
- 为克服传统方法在特征提取上存在的缺陷,提出一种基于Lempel-Ziv-Welch(LZW)压缩算法的未知恶意代码检测方法.忽略未知恶意代码结构将其看成字符串流,依据事先确定的阈值限制抽取的字符串长度,以实现处理效率和性能间的折衷;将所抽取的字符串按照其类别建立符合统计特性的压缩字典,即正常代码和恶意代码字典;利用2个字典对待测文件进行压缩,得到不同的压缩率,依据最小描述长度原则将其归类为能取得最好压缩率的类别,达到检测未知恶意代码的目的.实验结果表明,基于LZW算法的检测方法对未知恶意代码具有较好的识别效果.
- 赖英旭刘宏楠杨震刘静
- 关键词:未知恶意代码最小描述长度
- 基于虚拟机的安全技术研究被引量:13
- 2011年
- 由于虚拟机的高隔离性以及对系统、应用的透明性,使得很多安全技术是基于虚拟机实现的.提出一种基于Xen的安全架构,可将现有安全程序移植到该架构上,并保证其功能性,如文件、内存扫描以及主动防御技术.由于大量减少处于被保护虚拟机中的安全程序组件,使得安全程序本身具有更高的安全性,同时利用半虚拟化I/O技术将系统开销降低到最小,具有实用性.该框架还可将其他基于虚拟机的安全技术整合进来,且不需要修改现有的操作系统及应用程序,因此具有较强的适用性.
- 赖英旭胡少龙杨震
- 关键词:虚拟机内存保护