您的位置: 专家智库 > >

吉林省科技发展计划基金(20090704)

作品数:11 被引量:26H指数:3
相关作者:李雄飞李巍孙涛李军李军更多>>
相关机构:吉林大学长春理工大学教育部更多>>
发文基金:吉林省科技发展计划基金国家科技支撑计划国家自然科学基金更多>>
相关领域:自动化与计算机技术金属学及工艺更多>>

文献类型

  • 11篇期刊文章
  • 1篇会议论文

领域

  • 11篇自动化与计算...
  • 1篇金属学及工艺

主题

  • 4篇文档
  • 4篇聚类
  • 4篇XML文档
  • 2篇数据挖掘
  • 2篇聚类研究
  • 2篇可扩展
  • 2篇可扩展标记语...
  • 2篇扩展标记语言
  • 2篇XML
  • 2篇AUC
  • 2篇标记语言
  • 1篇样例
  • 1篇有序树
  • 1篇树算法
  • 1篇数据分布
  • 1篇数据库
  • 1篇数据库安全
  • 1篇数据库模型
  • 1篇权限
  • 1篇人工智能

机构

  • 12篇吉林大学
  • 3篇长春理工大学
  • 2篇教育部
  • 2篇新疆师范大学
  • 1篇北京邮电大学
  • 1篇韩山师范学院
  • 1篇中国科学院长...
  • 1篇长春轨道客车...

作者

  • 9篇李雄飞
  • 5篇李巍
  • 4篇孙涛
  • 3篇董元方
  • 3篇李军
  • 2篇徐沛娟
  • 2篇赵海英
  • 2篇李军
  • 1篇陈建孝
  • 1篇武佳薇
  • 1篇郭建芳
  • 1篇特日根
  • 1篇刘丽娟
  • 1篇王利民
  • 1篇刘兆军
  • 1篇罗梓恒
  • 1篇叶苑苑
  • 1篇王婧
  • 1篇李卓
  • 1篇郑晶

传媒

  • 3篇吉林大学学报...
  • 2篇吉林大学学报...
  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇计算机学报
  • 1篇计算机工程
  • 1篇软件学报
  • 1篇计算机工程与...

年份

  • 1篇2016
  • 1篇2015
  • 1篇2014
  • 3篇2013
  • 1篇2012
  • 2篇2011
  • 1篇2010
  • 2篇2009
11 条 记 录,以下是 1-10
排序方式:
基于冰冻结构的XML文档聚类研究被引量:1
2009年
为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。
李巍孙涛叶苑苑李雄飞李楠
关键词:XML文档文档聚类
XML空间频繁变化结构挖掘方法被引量:1
2013年
XML数据在实际使用过程中不断发生改变,针对XML数据动态可变的特点,提出一种根据XML数据变化过程挖掘XML空间频繁变化结构SFCS(Spatial Frequently Changing Structure)的方法,首先提出XML子结构空间度量方法,通过结构空间变化度SSCD、版本空间变化度VSCD和空间变化程度SCD这3个度量值衡量XML子结构的空间变化频繁性并提出SFCS定义.进一步,提出一种用于保存XML空间变化信息和发现SFCS的数据模型SC-DOM,论证了XML编辑操作对子结构空间的影响并据此提出SC-DOM状态动态迁移方式,最后提出根据SC-DOM发现SFCS的算法并讨论算法复杂度.实验结果表明SFCS是频繁变化的结构,使用SC-DOM模型进行SFCS挖掘是有效且可扩展的.
李巍李雄飞郭建芳
关键词:数据挖掘XML
对象间矢量感应聚类算法
2011年
从万有引力角度考虑,质点之间相互影响包括距离和方向两个方面.本文讨论数据之间的矢量感应,并将其应用于聚类算法VICA.引入对象的标量感应函数和方向感应函数,提出矢量感应函数概念.并给出确定方向感应函数的两个方法:方向相似度法和累加法.将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域均匀感应程度,将与均匀感应核心对象均匀感应密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除了稀疏感应对象这类噪声,并且可以解决高维数据聚类边界区分不明显、密度分布不均、类边界噪声对象多的问题,提高了聚类精度.由于感应函数是一个泛化定义,算法具有通用性和可扩展性.将半结构化数据变换到欧式空间时,容易出现边界稀疏对象,算法可以有效处理噪声.因此,算法适用于大规模的高维数据集合,也可用于半结构化数据聚类.
李雄飞孙涛武佳薇
关键词:聚类
基于加权余弦相似度的XML文档聚类研究被引量:13
2010年
在实际应用中,XML(eXtensible Markup Language)文档中的一些结构经常被改变。为了挖掘XML文档在历史变化过程中经常改变的结构所蕴含的知识,提出了发现频繁变化结构的方法。该方法用一组频繁变化结构组成的文档向量模型代表一个XML文档,将频繁变化结构在簇中的出现比例作为权值,使用加权余弦相似度对XML文档进行聚类。经过实验分析,根据XML文档历史变化过程中的频繁变化结构能较好地将XML文档进行聚类。用加权余弦相似度对XML文档进行聚类,其聚类结果的正确率、召回率和簇内部距离均优于使用非加权余弦相似度对XML文档进行聚类得到的结果。
李巍孙涛陈建孝罗梓恒李雄飞
数据分布不敏感的决策树算法被引量:1
2009年
传统的决策树算法是数据分布敏感的,面对数据分布偏斜的样本集时,常导致少数类别样本的分类精度很低。已有的可以处理偏斜样本集的决策树算法只针对两种类别样本的集合。由此提出了一种新的数据分布不敏感的决策树算法——DTID。该算法通过构造各种新的少数类别样本,调整样本集合的数据分布,提高少数类别样本的分类精度。DTID算法采用样本取模运算减少了算法的运行时间。实验结果表明,与C4.5等算法相比,DTID的分类精度明显提高,即使样本集中包含多种少数类别样本也能获得较好的分类效果。
孙涛李雄飞刘丽娟
关键词:人工智能决策树算法
考虑层数信息的XML文档聚类方法
2014年
提出了一种层数敏感的XML文档数据集聚类方法CXLI。首先提出结构表概念,消除XML文档的重复和嵌套结构。然后提出考虑层数信息的XML文档基本编辑操作约束。进一步给出考虑层数信息的XML文档间相似性度量方法。最后使用凝聚型层次聚类方法对XML文档数据集进行聚类。在ACM SIGMOD数据集和人工生成的数据集上进行了实验验证,结果表明:在计算时间基本相同的情况下,CXLI方法具有更好的精确度。
刘兆军赵浩宇王婧李雄飞李巍
关键词:数据挖掘可扩展标记语言聚类层数
一种新的不平衡数据学习的性能评估方法
在不平衡数据学习问题中,不同类别上的正确率对总体性能有不同的贡献,而AUC并没有反映这一点。本文提出一种新的分类器性能评估度量wAUC和一种新颖的求取wAUC值的方法。这种方法对于TPrate取不同值的区域,采用不同的权...
董元方李雄飞李军赵海英
关键词:AUC
基于角色的多级安全数据库模型被引量:1
2015年
为提高数据库模型的安全性,同时满足用户对数据的合理化存储要求,对RBAC模型与MLR模型进行改进,构造一个结合RBAC模型与MLR模型的综合访问控制模型,使主体通过多级角色间接应用强制访问控制规则来访问客体。实验结果表明,该模型可实现系统中主体对客体的灵活管理,同时具备强制访问控制模型的高安全性。
徐沛娟郑晶徐茂敬
关键词:数据库安全RBAC模型访问控制模型操作权限
基于分辨粒度的gROC曲线分析方法被引量:5
2013年
ROC曲线是模型选择的一种重要方法,但ROC曲线的不确定性影响了模型选择的准确性.基于分辨粒度,从反映得分的不确定性的角度提出gROC和gAUC的概念,从理论上讨论了gROC的若干性质.在给出其算法之后,利用双正态模型检验了gROC的合理性.在此基础上,提出了两个模型选择度量——AUC和AUC,并在UCI数据集上验证了该模型选择度量的高效性.实验结果表明,gROC能够有效反映ROC曲线的不确定性,基于AUC和AUC的模型选择方法优于基于AUC或sAUC的模型选择方法,在某些情况下,gROC具有更强的对分类器性能的比较能力.
董元方李雄飞李军李军
关键词:ROC曲线粒度
动态有序树存储模型与实现方法被引量:4
2013年
XML作为半结构化数据模型的代表,其文档较大,存储动态有序树时需要较多空间成为其明显的缺点,对XML文档进行二进制的编码压缩可以有效地减少存储空间.提出了一种不仅可以对有序树进行空间高效存储,又可以实现有序树的动态化操作的封装包结构.此结构通过将有序树的二进制编码段分段处理的方法,减少了修改量.并通过三重定位的方法快速选定要修改的封装包.针对有序树动态化后出现的节点意义丢失的问题,提出了对树进行辅助描述的高效节点序号表,通过节点序号表可以记录每个节点的内容及意义,进而补充了二进制编码只能表示树结构的缺点.并通过建立有效的序号修改表对其进行快速高效的更新.通过设计对动态树的各种常用操作,并计算出各种操作的空间及时间复杂度,表明了通过此结构可以实现动态有序树的空间高效存储.
特日根李巍李雄飞
关键词:XML压缩查询处理二进制编码
共2页<12>
聚类工具0