您的位置: 专家智库 > >

陈冲

作品数:2 被引量:2H指数:1
供职机构:南京航空航天大学计算机科学与技术学院更多>>
发文基金:江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇数据处理
  • 2篇流数据
  • 2篇流数据处理
  • 1篇多线程
  • 1篇数据流
  • 1篇通配符
  • 1篇线程
  • 1篇模式匹配算法
  • 1篇XML模式
  • 1篇XML数据
  • 1篇XML数据流
  • 1篇查询

机构

  • 2篇南京航空航天...

作者

  • 2篇蒋夏军
  • 2篇陈冲
  • 1篇张青平

传媒

  • 1篇计算机与现代...
  • 1篇计算机科学与...

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
并行的XML数据流模式匹配算法
2015年
随着大数据时代的到来,大规模XML文件不断地涌现,其信息庞大,结构复杂,而传统的XML查询匹配技术需要大量的存储空间和预解析工作,不能有效解决XML大文件的匹配要求。针对这种现状,分析了现有经典匹配算法核心思想,并结合多线程并行相关知识,提出了一种新的并行的XML数据流模式匹配算法,称为并行路径流算法(parallel path stream,PPS)。该算法在以流模式顺序解析XML文件的过程中,缓存以查询模式根元素为根节点的子树,以顺序链表存储节点的编码信息,在进行有效过滤后加入任务链表中,采用独特的匹配方法并行操作任务池中的各个顺序链表后得到匹配结果。实验表明,该算法能够明显减少存储空间,其过滤过程和并行操作能够有效减少匹配时间,并在查询路径长度方面具有一定优势。
陈冲蒋夏军张青平
关键词:流数据处理多线程
一种支持通配符查询的XML模式匹配算法被引量:2
2016年
XML查询语言当中,包含通配符*的查询能够方便有效地满足一些特殊查询要求,但在大数据时代下XML文件容量与结构复杂性不断增加,现有支持通配符查询的算法需消耗巨量内存来解析XML,并且在对嵌套通配符处理时需要大量的单路径匹配操作和局部结果的缓存。针对此现状,结合现有经典算法,提出一种新的、能够高效解决小枝模式当中含有通配符*的查询算法—WTwig List。该算法首先对查询模式进行通配符的层次关系处理,减少不必要的通配符匹配,以数据流形式解析XML文件并执行局部的扩展Dewey编码,经过滤操作后得到有序的叶子节点编码列表,在列表中执行匹配操作得到结果;其次在真实和合成数据集上做大量实验,结果表明WTwig List算法与现有算法相比,能够有效提高查询效率,在空间效率上具有一定优势,且能够快速准确地处理查询模式中P-C关系。
陈冲蒋夏军
关键词:流数据处理
共1页<1>
聚类工具0