国家自然科学基金(61070131) 作品数:20 被引量:69 H指数:3 相关作者: 王浩 姚宏亮 徐勇 方宝富 丁忠明 更多>> 相关机构: 合肥工业大学 安徽财经大学 皖西学院 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 教育部人文社会科学研究基金 更多>> 相关领域: 自动化与计算机技术 文化科学 轻工技术与工程 电子电信 更多>>
基于频繁项集发现的匿名隐私保护算法 2011年 通过定义考虑权重的匿名表效用度量函数,用于在泛化步骤决定下一个泛化路径以取得较好的泛化效果,在此基础上提出利用频繁项集发现思想的微观数据表匿名隐私保护算法ABFI(algorithm based on frequent setmining),匿名过程仅仅对不满足隐私保护要求等价组中准码属性取值进行泛化。实验结果表明,该方法可以减少信息损失,求解得到更加符合数据分析任务需求的局部最优匿名表。 徐勇 丁忠明 司凤山关键词:数据发布 隐私保护 K-匿名 频繁项集 基于熵理论的匿名发布表质量度量方法研究 2011年 匿名发布表质量度量问题是微观数据发布匿名模型中的重要内容之一。已有相关研究工作主要从准码属性取值层次变化幅度或泛化等价组中元组记录数角度定义匿名发布表质量度量方法,具有度量结果不精确的缺点。基于信息熵理论,根据泛化前后等价组中准码属性在不同层次取值包含的精确信息量变化情况,结合考虑具体数据分析任务对准码属性敏感程度不同因素为不同准码属性泛化路径设置权重,设计一组细粒度的匿名发布表隐私保护程度和信息损失程度度量方法。实验分析表明,利用该方法能够更加精确地度量泛化匿名表质量。 徐勇 丁忠明 王浩 黄灿关键词:隐私保护 信息损失 K-匿名 数据发布 多追捕者-单-逃跑者追逃问题实现成功捕获的约束条件 被引量:9 2012年 针对包含有n个追捕者及1个逃跑者的2维平面多机器人追逃问题,对实现成功捕获的约束条件进行了研究.经过理论分析得出:在机器人拥有全局视野的情况下,即使单一逃跑者性能优于每个追捕者,只要满足追捕者与逃跑者的速率比大于sin(π/n),逃跑机器人落在追捕机器人所构成的凸多边形内部且逃跑者和追捕者构成的相邻追-逃阿波罗尼奥斯圆满足两两相交(相切)这2个约束条件,则追捕者通过选择合适的追捕策略就一定可以实现成功抓捕.此外,还给出了在此约束条件下的追捕者和逃跑者的追逃策略.多组仿真实验同样证明了本文提出的约束条件是正确的. 方宝富 潘启树 洪炳镕 丁磊 蔡则苏关键词:多机器人系统 生物缺失数据处理的贝叶斯模型研究 被引量:3 2011年 文章针对生物信息实验中的分类预测问题,以属性缺失数据为对象,结合朴素贝叶斯算法的特点,设计了一种基于改进EM算法的缺失数据朴素贝叶斯填充模型,并应用于蛋白质作用位点的定位研究中.实验结果表明,通过算法进行生物缺失数据的处理,在准确率、精度、召回率、ROC方面均获得了比其他方法更好的效果. 沈奇 王池社关键词:缺失数据 朴素贝叶斯 一种求解聚类问题的分布估计算法 被引量:3 2011年 提出一种求解聚类问题的分布估计算法。基于PBIL算法定义聚类矩阵,建立对应的概率矩阵模型,引入遗传算法的基因变异算子,设计适用于分布估计算法的变异操作,改进概率模型的更新方式。实验结果表明,与Kmeans、Kmedioid、Clarans和遗传算法相比,该算法的聚类质量较好。 周本达 姚宏亮 李国成关键词:聚类 分布估计算法 遗传算法 蚁群与粒子群混合算法求解TSP问题 被引量:26 2012年 旅行商问题(TSP)是最古老而且研究最广泛的组合优化问题。针对TSP问题,提出一种蚁群与粒子群混合算法(HAPA)。HAPA首先将蚁群划分成多个蚂蚁子群,然后把蚂蚁子群的参数作为粒子,通过粒子群算法来优化蚂蚁子群的参数,并在蚂蚁子群中引入了信息素交换操作。实验结果表明,HAPA在求解TSP问题中比传统算法和同类算法更具优越性。 孙凯 吴红星 王浩 丁家栋关键词:蚁群算法 粒子群优化算法 旅行商问题 微观数据外包管理中的安全问题研究进展 2011年 详细剖析了微观数据外包管理中的安全问题内涵,系统评述了微观数据外包管理应用系统数据机密性保护、查询验证、隐私保护等安全问题的研究进展,最后探讨了微观数据外包管理安全问题研究的发展趋势。 徐勇 丁忠明 沈小玲关键词:查询验证 隐私保护 面向自然语言描述的Web服务组合 目前Web服务组合通过服务流程描述语言进行配置,为了使Web服务组合变得更加简便,本文为Web服务组合提供自然语言接口,使普通用户可以运用自然语言描述自己的需求调用和组合Web服务,该方法分析自然语言描述中的控制流和服务... 张玉军 李心科关键词:自然语言处理 语义相似度 文献传递 多Agent动态影响图的一种混合近似推理算法 被引量:2 2011年 多Agent动态影响图模型适合于对动态环境中多Agent问题进行建模,Agent之间结构关系被表示成局部的概率因式形式.概率图模型推理所面临的一个主要问题是难以实现近似推理的精度和复杂性之间的均衡.近似推理方法可提高推理精度,但同时也会带来推理精度的损失.BK和粒子滤波(PF)是动态概率模型两种重要的近似推理算法,BK算法有较高的计算效率但会引入较大的误差,PF可以近似任意分布但存在计算的高维问题.结合BK和PF的优点,提出多Agent动态影响图(MADIDs)的一种混合近似推理算法.根据概率图模型的可分解性,将MADIDs分解生成用于推理的原型联合树,混合近似推理算法在规模复杂度较小的团上执行PF推理以达到局部最佳估计,而在其他的团上执行BK推理,为了减小推理误差引入了分割团.仿真实验表明混合近似推理算法是MADIDs模型的一种有效推理方法,与BK和PF算法相比,该算法显著提高了推理精度,且可以实现推理精度和时间复杂性之间的均衡. 姚宏亮 王秀芳 胡大伟 王浩 茆美琴关键词:粒子滤波 多AGENT动态影响图 联合树 隐私保护的数据挖掘方法的研究 被引量:11 2011年 介绍了隐私保护数据挖掘方法的产生背景和意义,其次概括了现阶段国内外隐私保护数据挖掘算法的研究现状,并对当前隐私保护数据挖掘领域中已提出的算法按照数据挖掘的方法、数据源分布情况、隐私保护技术和隐私保护对象以及数据挖掘应用类型等方面进行分类,然后分别详细阐述了在集中式和分布式数据分布环境下,应用在隐私保护的关联规则挖掘、分类和聚类挖掘中的一些典型的技术和算法,总结出它们的优缺点,并对这些优缺点进行剖析和对比,最后指明了隐私保护数据挖掘算法在未来的整体发展方向。 汤琳 何丰关键词:隐私保护数据挖掘 聚类挖掘 分布式数据