江苏省高技术研究计划项目(BG2007028)
- 作品数:13 被引量:24H指数:3
- 相关作者:杨鹤标朱玉全陈耿吕晓李云平更多>>
- 相关机构:江苏大学南京审计大学西安电子科技大学更多>>
- 发文基金:江苏省高技术研究计划项目国家自然科学基金江苏省“六大人才高峰”高层次人才项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于概率分布的临床行为检测模型被引量:1
- 2011年
- 为了能对无明显时序关系或时间记录不完整的单病种的临床行为进行有效地异常检测,提出了一种基于概率分布的异常检测模型。该模型采用频率直方图和参数估计等统计学方法来确定每类临床行为的概率分布,根据确定的概率分布,采用区间选取算法来确定每类临床行为的正常的取值区间,从而生成临床行为规则库。当检测待检行为是否异常时,只需查看待检行为的统计频率是否在阈值范围内即可。通过对高血压病种降压类用药进行实验,结果表明,该模型可以有效地检测异常的临床行为。
- 杨鹤标史晓丽
- 关键词:异常检测概率分布统计学
- 适用于非平衡数据的多关系多分类模型
- 2010年
- 针对多关系多分类的非平衡数据,提出一种分类模型。在预处理阶段,建立目标类纠错输出编码(ECOC)、目标关系与背景关系间的虚拟连接并完成属性聚集处理,进而划分训练集和验证集。在训练阶段,依据一对多划分思想,结合CrossMine算法构造多个子分类器,采用AUC法评估验证各子分类器。在验证阶段,比较目标类ECOC与各子分类器分类结果连接字的海明距离,选择最小海明距离的目标类为最终分类。经合成和真实数据的实验,验证了模型有效性及分类效果。
- 杨鹤标王健
- 关键词:非平衡数据多类分类纠错输出编码
- DPCM与EZW混合编码在医学图像中的应用研究被引量:2
- 2010年
- 现代医疗成像设备产生了大量高价值的医学图像,如何对信息进行有效的存储、查询以及网络传输是一个亟待解决的问题。利用整数小波变换和零树编码算法对医学图像进行了压缩研究,在对嵌入零树小波编码(Embedded Zero-tree Wavelet,EZW)算法研究的基础上提出一种基于小波系数的嵌人零树小波编码算法。其主要包括:对小波图像的低频子带(LL)进行单独DPCM编码;对高频子带改变扫描方式以获得最佳编码排序,最后用游程编码(RLE)实现输出。实验结果表明,该方法是一种比较有效的编码方法。
- 翟国宋余庆谈佳宁徐庆
- 关键词:医学图像整数小波变换提升方法嵌入式零树小波
- 频繁闭项目集更新算法
- 2008年
- 挖掘频繁闭项目集是数据挖掘领域中的一个重要研究方向,人们已提出了许多用于高效地发现大规模数据库中频繁闭项目集的算法,但对其更新维护问题的研究却比较少.在分析了频繁闭项目集更新算法关键技术的基础上,提出一种快速的增量式频繁闭项目集更新算法FUFCIA(fastupdating frquent closed itemsets algorithm),该算法将充分利用先前挖掘过程中所产生的信息来节省发现新的频繁闭项目集的时间开销,降低了候选频繁闭项目集的规模,减少了扫描数据库的次数.最后对该算法进行分析和讨论,并进行试验验证,试验结果表明算法FUFCIA是有效的.
- 朱玉全吕晓陈耿
- 关键词:数据挖掘频繁闭项目集
- 基于UML活动图的功能测试场景生成方法被引量:5
- 2011年
- 提出一种基于统一建模语言(UML)活动图的功能测试场景生成方法。在给出活动图形式化定义的基础上,划分并压缩循环结构模块与并发结构模块,采用带回溯的深度优先遍历法提取含有复合节点的测试场景,进行解压循环与并发。利用拓扑反蚁群算法处理并发结构模块,解决并发活动排序导致的场景爆炸问题,根据路径复杂性设置场景优先级以提高测试效率。应用结果验证了该方法的可行性和实用性。
- 杨鹤标李云平
- 关键词:活动图并发统一建模语言
- 基于聚类的动态物化视图选择研究被引量:3
- 2009年
- 物化视图选择方法大多是静态的,违背了联机分析处理和决策支持系统的动态本质。现有的动态算法也不能实现完全的动态化,为此提出了一种数据仓库中基于聚类的动态物化视图选择算法CBD-MVS(clustering-based dynamic materialized view selection),该算法采用层次聚类技术对用户查询语句进行聚类,提出视图合并算法建立候选物化视图,利用BPUS(benefitper unit space)算法生成最终应该被物化的视图。实验结果表明该算法是有效可行的,由于采用聚类技术,实现了完全的动态化。
- 吕晓陈耿朱玉全
- 关键词:数据仓库物化视图选择聚类
- 基于Cascade的增量式组合分类算法研究
- 2009年
- 利用Learn++思想对Cascade组合分类器进行了改进,提出了一种基于Cascade的增量式组合分类算法,并将之应用到肝脏图像的分类中。实验结果表明,与原有组合分类器相比,该增量式组合分类方法可以在保证分类准确度的前提下有效地提高新增样本的学习效率。
- 欧吉顺朱玉全陈耿刘晟
- 关键词:多分类器组合增量式更新BOOSTING
- 序列模式挖掘中的隐私保护方法研究被引量:4
- 2009年
- 目前,已提出了一些关联规则挖掘中的隐私保护方法,而对序列模式挖掘中隐私保护的研究却很少。为此,提出了一种有效的敏感序列隐藏算法CLSDA(current leasts equences delete algorithm),该算法对候选序列加权,在删除序列的过程中随时更新权值,使用贪心算法获得局部最优解,尽可能减少对原始数据库的改动。实验结果表明,与现有序列模式隐藏方法相比,算法CLSDA将具有更好的隐藏效果。
- 朱玉全胡天寒陈耿常鹏
- 关键词:数据挖掘隐私保护
- 基于有损连接的个性化隐私保护被引量:2
- 2011年
- 数据表的k-匿名化(k-anonymization)是数据发布环境下保护数据隐私的一种重要方法,在此基础上提出的(,)-匿名模型则是有效的个性化隐私保护方法,泛化/隐匿是实现匿名化的传统技术,然而该技术存在效率低,信息损失量大等缺陷。针对上述问题,引入有损连接的思想,提出了基于贪心策略的(,)-匿名聚类算法,该方法通过准标识符属性和敏感属性间的有损连接来保护隐私数据。实验结果表明,与泛化/隐匿方法相比,该方法在信息损失量和时间效率上具有明显的优势,可以获得更好的隐私信息保护。
- 张志祥金华朱玉全陈耿
- 关键词:隐私保护K-匿名泛化
- 基于结构相似匹配的SQL程序自动评估模型研究被引量:3
- 2010年
- 针对SQL语言编程能力评估的多因素影响、界限模糊特性造成的难度和偏差问题,本文提出了基于结构相似度匹配的评估模型(SQL-APAM)。结合静态评估与动态评估方法,给出了模型的整体框架;模型对提交的SQL语句进行规范化、分词处理后,将其转换成等价的单词序列对,进而构建对应的结构树S-tree;使用于代价模型、子结构贡献因子两方面上有所改进的树编辑距离算法计算与目标树的相似性值;最后利用正态分布思想将相似度值映射到成绩区间,并通过相似度阈值来调整影响因素所带来的偏差,给出SQL程序的定量评判结果。最后对模型作了基于数据的实验分析与验证,训练数据集进行参数调整,对模型进行优化。
- 杨鹤标刘玲杨立凡
- 关键词:分词