您的位置: 专家智库 > >

余海洋

作品数:1 被引量:0H指数:0
供职机构:厦门大学信息科学与技术学院更多>>
发文基金:国家自然科学基金福建省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇数据清理
  • 1篇PAS
  • 1篇PASS
  • 1篇J
  • 1篇S-
  • 1篇JOIN

机构

  • 1篇厦门大学
  • 1篇广东石油化工...

作者

  • 1篇林琛
  • 1篇余海洋
  • 1篇邹权
  • 1篇江弋
  • 1篇陈珂

传媒

  • 1篇计算机科学与...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
Pass-Join-K:多分段匹配的相似性连接算法
2013年
相似性连接是数据清理工作的基本模型,获得了大量数据库工作者的关注。研究了基于编辑距离的相似性连接问题,即在两个字符串集合中寻找编辑距离小于一个阈值的字符串对,并在Pass-Join算法的基础上,提出了一个新的Pass-Join-K算法。Pass-Join—K算法在长短字符串上都有很好的表现。该算法的主要思想是利用Pass-Join算法的划分原理,以多次匹配的方式,达到更加严格地选取候选配对的目的。实验结果显示,Pass-Join-K算法减少了候选对的数量,在实际数据集上相比元算法在运行时间上有2~5倍的提升。
余海洋林琛陈珂江弋邹权
关键词:数据清理
共1页<1>
聚类工具0