国家自然科学基金(61373037)
- 作品数:6 被引量:149H指数:4
- 相关作者:何克清何非王健徐建建田刚更多>>
- 相关机构:武汉大学山东科技大学铜仁学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划博士科研启动基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向领域标签辅助的服务聚类方法被引量:30
- 2015年
- Web服务数量的激增对服务发现提出了更高的要求,服务聚类是促进服务发现的一种重要技术.但是,现有服务聚类方法只对单一类型的服务文档进行聚类,缺乏考虑服务的领域特性和服务标签的应用.针对这些问题,本文首先使用本体辅助的支持向量机和面向领域的服务特征降维技术建立服务的特征内容向量,然后使用一种标签辅助的主题服务聚类方法 T-LDA建立融合标签信息之后的隐含主题表示,并利用归一化方法消除通用主题的影响,综合上述方法建立一个面向领域标签辅助的Web服务聚类方法 DTWSC.实验结果表明,该框架能够提高针对不同类型的服务文档的聚类效果.与LDA、K-Means等方法相比,该方法在聚类纯度、熵和F-Measure指标上均具有更好的效果.
- 田刚何克清王健孙承爱徐建建
- 关键词:主题模型
- 基于局部划分的匿名算法研究被引量:3
- 2019年
- 针对泛化会造成数据信息损失量较大,且该缺陷会随数据维度变大而越明显的问题,提出一种基于局部划分的匿名算法。在确保k-匿名和l-多样性的前提下,基于敏感属性栏值约束和记录间距离将数据表横向分成若干个桶,然后对每个桶基于属性间的关联纵向分成多栏,最后对同一桶中各栏中的数据进行随机重排。实验结果表明,在处理高维数据时,与LGAA-CP算法相比,信息损失量减少了47%~183%,关联关系保留率提高了24%~118%。与Slicing算法相比,信息损失量相差在1.5%之内,关联关系保留率提高了8.9%~22.8%。通过分析,该算法在同时确保高维数据的隐私保护能力和数据可用性方面是有效的。
- 王芳余敦辉张万山
- 关键词:K-匿名
- 基于数据流约束的可配置业务流程分析与验证被引量:5
- 2017年
- 可配置的业务流程模型通过隐藏、阻断或允许可配置业务过程模型中的某些片段来实现流程配置,在实际配置过程中可能会导致不正确的配置。针对这一问题,采用着色Petri网作为形式化模型表达业务过程模型,同时在流程的控制流加入数据流,将活动产生的数据流整合到基于数据流的业务流程模型,从而使待处理的业务过程模型具有数据流的语义。通过在业务流程模型中添加配置操作,将基于数据流的业务流程模型转换成基于数据的可配置业务流程模型。最后,使用ASK-CTL逻辑表达基于数据流的可配置业务过程模的型数据语义约束,然后应用着色Petri网的相应工具分析和验证了该模型的数据语义约束的属性正确性,表明了所提方法的有效性。
- 黄贻望徐松金冯在文黄颖何克清彭长根
- 关键词:着色PETRI网数据流
- 大数据及其科学问题与方法的探讨被引量:109
- 2014年
- 大数据的规模和复杂度的增长超出了计算机软硬件能力增长的摩尔定律,对现有的IT架构以及计算能力带来了极大挑战,也为人们深度挖掘和充分利用大数据的大价值带来了巨大机遇.因此,针对网络大数据的共性规律和科学问题,需要研究网络大数据定性定量分析的基础理论与方法.本文重点分析了大数据在数据关联上的复杂性、计算复杂性、系统的复杂性、学习复杂性四个方面的主要研究问题和现状,介绍小结了产业界具有代表性的实际应用IT基础架构,以形成从网络大数据的感知、挖掘获取、质量评估、数据提炼处理到融合表示的综合过程图景,最后对大数据科学、数据计算需要的新模式与新范式(第四范式)等方面的发展趋势和方向进行了展望探讨.
- 何非何克清
- 关键词:大数据