您的位置: 专家智库 > >

林伟坚

作品数:4 被引量:3H指数:1
供职机构:南开大学更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 3篇自动化与计算...

主题

  • 3篇文档
  • 2篇文档相似度
  • 2篇相似度
  • 2篇XML文档
  • 1篇新闻
  • 1篇新闻资讯
  • 1篇数据库
  • 1篇数据库技术
  • 1篇数据挖掘
  • 1篇去重
  • 1篇去重算法
  • 1篇抓取
  • 1篇自然语言
  • 1篇文档分类
  • 1篇相似度计算
  • 1篇结构信息
  • 1篇N-GRAM
  • 1篇XML
  • 1篇程序语言

机构

  • 4篇南开大学

作者

  • 4篇林伟坚
  • 3篇袁晓洁
  • 3篇廉鑫
  • 2篇张海威
  • 1篇汪陈应

年份

  • 1篇2012
  • 3篇2010
4 条 记 录,以下是 1-4
排序方式:
基于双向路径约束模型的XML文档结构相似性度量
为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML文档的结构信息,为更精确的XML相似度计算打下基础.引入自然语言领域中成熟的N-Gram思想...
廉鑫林伟坚张海威袁晓洁
关键词:XML文档相似度N-GRAM
文献传递
一种计算XML文档相似度的方法
本发明属于数据库技术领域,建立一种XML文档约束模型,称为双向路径约束模型。基于这种模型提出一种新的计算XML文档相似度的方法。它通过节点的双向路径约束更全面的提取XML文档的结构信息,有利于更精确的衡量XML文档之间的...
汪陈应袁晓洁廉鑫林伟坚
文献传递
基于双向路径约束模型的XML文档结构相似性度量
为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML文档的结构信息,为更精确的XML相似度计算打下基础。引入自然语言领域中成熟的N-Gram思想...
廉鑫林伟坚张海威袁晓洁
关键词:XML文档
基于Scrapy框架的新闻实时抓取及处理系统的设计与实现
随着Internet的飞速发展,互联网的信息大爆炸给人们带来信息过载的问题,新闻资讯作为人们接触最多的一种媒体信息,发布方式已经从传统媒体逐渐的转移到互联网上。新闻资讯作为互联网信息的重要组成部分也在急剧的增加。在此背景...
林伟坚
关键词:新闻资讯数据挖掘程序语言去重算法
文献传递
共1页<1>
聚类工具0