国家自然科学基金(60873247) 作品数:52 被引量:351 H指数:9 相关作者: 刘培玉 朱振方 赵静 杨玉珍 李凤银 更多>> 相关机构: 山东师范大学 山东省分布式计算机软件新技术重点实验室 山东警察学院 更多>> 发文基金: 国家自然科学基金 山东省自然科学基金 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 更多>>
应用特征项分布信息的信息增益改进方法研究 被引量:14 2009年 在特征项分布不平衡的情况下,传统信息增益算法的分类性能会急剧下降,针对此缺陷提出了一种利用特征项分布信息来改进信息增益公式的计算方法。通过计算特征项分布信息来判定特征项是否存在不平衡性,并利用此信息来平衡特征项不出现时对分类精度的影响。通过实验验证,改进后的计算方法整体上比传统的信息增益算法具有更好的性能。 杨玉珍 刘培玉 朱振方 邱烨关键词:信息增益 类内离散度 应用于入侵取证的改进信息增益算法 被引量:1 2011年 基于信息增益算法的特征选择虽然能够较好地解决入侵取证中存在的数据高维海量问题,但由于没有考虑特征之间的关系,导致特征子集中存在着冗余特征,从而影响了入侵取证的速度和精度,由此提出一种改进的基于特征冗余度的信息增益算法。通过添加对特征之间冗余度的判断,在删除无关特征的同时过滤了冗余特征,使特征子集得到有效精简。经实验验证,该算法能有效地选择特征向量,保证检测精度,提高检测速度。 贾娴 刘培玉 公伟关键词:入侵取证 信息增益 支持审计与取证联动的日志系统设计 被引量:7 2009年 目前国内外缺乏综合数据提炼能力的日志搜索和分析系统,也还没有专门同时为安全审计与计算机取证目的设计的日志保护和分析工具,针对这一现状,分析并提出了一种日志综合分析平台,以支持网络审计与计算机取证。描述了这种安全日志文件系统的构建、采集、管理和保护,可以做到审计与取证的联动分析,形成了一个高可信审计与取证能力的基本通用模型。最后给出了系统实现的界面和系统的性能分析。 宁兴旺 刘培玉关键词:主机日志 审计 计算机取证 基于LDA的新闻话题子话题划分方法 被引量:18 2013年 针对目前网络热点新闻话题中存在的难以区分一个话题下的多个子话题现象,提出一种基于LDA模型的子话题划分方法.首先应用LDA模型对新闻文档进行建模,采用贝叶斯标准方法确定最优主题个数,使LDA模型拟合文档性能达到最佳;其次针对子话题间文本相似度较高的特点,引入主题特征词相关性分析,采用改进的KL距离公式,计算新闻文档之间相似度,有效区分了文档内容相似但话题重点不同的报道;最后通过single-pass增量聚类算法进行文档聚类,实现子话题划分.实验验证了改进后的相似度计算方法的有效性,实验结果表明该方法能够有效地提高热点新闻话题子话题划分的准确率. 赵爱华 刘培玉 郑燕关键词:KL距离 相似度计算 基于细分变异算子策略的遗传算法 被引量:1 2012年 针对基本遗传算法局部搜索能力不强以及早熟的问题,提出基于细分变异算子的遗传算法(Genetic Algorithm Based on Subdividing Mutation,SMSGA)。SMSGA将变异算子依据进化历程分成大步前进算子和最优调教算子。大步前进算子防止遗传早熟现象的发生;最优调教算子加强局部搜索的能力。同时,为加快算法收敛速度,对遗传操作实施策略进行优化,引入了路由选择操作。选用3个典型的测试函数在MATLAB平台中对该算法与基本遗传算法以及采用双变异率的改进遗传算法进行比较分析,结果表明,SMSGA可以有效的避免遗传算法中存在的局部搜索能力差和早熟现象的出现。 王乾龙 刘培玉关键词:遗传算法 精英保留 向量空间模型中结合句法的文本表示研究 被引量:6 2011年 为增强向量空间模型(VSM)中项的语义描述性,克服VSM中各语义单元相互独立的缺陷,提出一种基于短语的特征粒度描述方法。该方法从文本的表示及特征项之间的组织方式入手,通过句法规则识别基本短语,构建特征与中心动词的关系树,利用基本短语代替BOW中的词。实验结果表明,采用基本短语的文本表示可提高分类的性能,增加项之间的联系,克服特征项相互独立的缺陷,在特征数量较少的情况下仍能保持良好的分类效果。 杨玉珍 刘培玉 姜沛佩关键词:短语 句法规则 关系树 文本表示 安全的无证书代理盲签名方案 被引量:1 2014年 无证书公钥密码体制和代理盲签名都因其自身的优点而成为当前学术界的研究热点,但是有的无证书的代理盲签名存在一定的安全漏洞,如攻击者能够恢复出私钥、跟踪签名信息等.本文结合代理签名和盲签名的优点,利用无证书公钥密码体制和双线性对构造了一个安全高效的代理盲签名方案.经过安全性分析,该方案满足代理盲签名的盲性、不可伪造性、可验证性、不可否认性等安全特性,能够应用于电子商务、电子政务等保护用户隐私且需要代理签名的场合,具有较高的执行效率. 王珍 刘培玉 崔涛 李凤银关键词:无证书密码体制 双线性对 代理盲签名 一种基于反向K近邻的孤立点检测改进算法 被引量:3 2014年 基于反向k近邻的孤立点检测算法能够从全局角度较好地检测孤立点,但是在初始阶段求数据点的k近邻时,基本算法需要O(KN2)次数据点间的距离计算,不适合大数据集。同时参数k值的选取对数据集中孤立点的确定产生很大的影响。为此采用自适应的方法确定参数k值,然后提出一种利用度量空间的三角不等式的快速挖掘算法提前剪枝,减少孤立点检测时数据点之间距离计算的次数。理论分析和实验结果证明了算法的可行性和高效性。 谢方方 徐连诚 牛冰茹关键词:孤立点 K近邻 三角不等式 剪枝 改进的访问统计方法及对用户兴趣度的计算 被引量:9 2011年 为解决传统的以点击量为标准的网络访问统计方法对网络访问量表示不准确的问题,分析了现有的两种统计方法,提出了一种改进的网络访问统计方法。在点击量的基础上,引入用户停留时间,并把两种统计量进行合并,设计了一个兼有点击量和停留时间两种衡量尺度的表示网络访问量的统计量。把改进的网络访问统计方法引入到对用户兴趣度的计算,并提出了改进的用户兴趣度量化定义,实验结果表明,改进的网络访问统计方法对用户兴趣度的表示更加合理有效。 张珠玉 刘培玉 朱振方 迟学芝关键词:访问统计 用户兴趣度 用户访问行为 点击量 邮件过滤中特征选择方法的性能评价与分析 被引量:7 2012年 基于内容的邮件过滤本质是二值文本分类问题。特征选择在分类之前约简特征空间以减少分类器在计算和存储上的开销,同时过滤部分噪声以提高分类的准确性,是影响邮件过滤准确性和时效性的重要因素。但各特征选择算法在同一评价环境中性能不同,且对分类器和数据集分布特征具有依赖性。结合邮件过滤自身特点,从分类器适应性、数据集依赖性及时间复杂度三个方面评价与分析各特征选择算法在邮件过滤领域的性能。实验结果表明,优势率和文档频数用于邮件过滤时垃圾邮件识别的准确率较高,运算时间较少。 赵静 刘培玉 许明英关键词:邮件过滤 朴素贝叶斯 支持向量机