您的位置: 专家智库 > >

郝晓丽

作品数:1 被引量:5H指数:1
供职机构:天津大学电子信息工程学院更多>>
发文基金:天津市自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文档
  • 1篇XML

机构

  • 1篇天津大学

作者

  • 1篇冯志勇
  • 1篇郝晓丽

传媒

  • 1篇计算机应用

年份

  • 1篇2005
1 条 记 录,以下是 1-1
排序方式:
XML结构聚类被引量:5
2005年
针对当前XML文档结构聚类算法的一些不足,提出采用段匹配的概念来计算两棵XML文档树中的路径相似性,并在此基础上得出两棵树整体的相似度量。在整个聚类过程中,算法还把一组相关文档与一个XML聚类代表相关联,该聚类代表就包含了一个文档集合中所有文档的最相关的特征。为了构建聚类代表,算法通过构造最佳匹配树,合并树,修剪树三步来实现。通过比较聚类代表,发现新的聚类时更新聚类代表来完成文档聚类。实验结果就充分展现了算法的有效性。
郝晓丽冯志勇
关键词:XML
共1页<1>
聚类工具0