国家重点基础研究发展计划(2006AA01Z201)
- 作品数:3 被引量:0H指数:0
- 相关作者:应捷曹苏燕何骏郑彦陈静更多>>
- 相关机构:南京邮电大学南京交通职业技术学院更多>>
- 发文基金:国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于领域本体的语义合成研究
- 2013年
- 为了在检索过程中全面挖掘用户查询信息,文中提出了一种基于领域本体的语义合成技术,该方法以文本为数据源,引用数据源和领域本体之间的映射关系来表达数据文本的语义。文章提出了一个语义合成模型,该模型由领域本体、关键词语义抽取、概念语义相似度计算及语义推理等相关技术模型组成。文中对该模型进行了实验验证,通过对实验结果进行分析推理可知,文中提出的基于领域本体的语义合成模型提高了检索系统的查准率和计算机处理信息的能力,从而也提高了用户的满意度。
- 林培金曹苏燕应捷
- 关键词:领域本体语义相似度概念映射
- 基于OWL的规则推理研究及应用
- 2013年
- 文中通过对基于OWL的本体构造方法,Jena通用推理机及推理规则的研究,尝试一种新的本体构造方法,以及针对此类本体所适用的规则。期望可以不局限于推理本体间的关系,而是能够针对本体的活动进行推理。为了证明该方法的可行性,实现了一个推理系统,在本体的构造过程中,加入了时间轴,并对其进行了推理研究。通过该推理系统及特殊的推理规则,可以利用本体间的关系或是本体基于时间轴的活动,推理出目标本体的活动。因此证明了该方法可以基于时间轴,有效地推理本体的活动。
- 丁志劼何骏应捷
- 关键词:OWLJENA时间轴
- 基于二叉树的并行频繁项集挖掘算法
- 2015年
- 大数据时代的到来,使得人们对数据的处理速度、利用率等方面的要求变得更高。在频繁项集挖掘方面,Count Distribution算法和Data Distribution算法是比较经典的并行频繁项集挖掘算法,由于挖掘过程中需要较大的存储空间和通信开销,挖掘效率并不十分理想。文中提出了一种基于二叉树的并行频繁项集挖掘算法,利用了MapReduce的并行性,先通过遍历二叉树的方法找出数据库中固定大小的所有子集,然后统计每个子集的出现次数,再与事先设定好的一个固定阈值进行比较,超过阈值的子集即为所求的频繁项集。通过对实验结果进行对比分析表明,提出的算法只需要一次MapReduce过程即可完成挖掘,充分利用了集群的并行性,不需要使用迭代的方式进行挖掘,性能上明显优于CD和DD算法,也就是说,该算法具有较高的挖掘效率。
- 陈静郑彦
- 关键词:频繁项集挖掘MAPREDUCE并行计算二叉树