李石生
- 作品数:4 被引量:5H指数:1
- 供职机构:河北大学数学与计算机学院更多>>
- 发文基金:河北省教育厅科研基金河北省科技攻关计划保定市科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于探测查询的Deep Web实体识别
- 目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别。因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并。该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体...
- 李石生刘海博路小英王亮
- 关键词:数据抽取
- 文献传递
- 基于探测查询的Deep Web实体识别被引量:1
- 2008年
- 目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.
- 李石生刘海博路小英王亮
- 关键词:DEEPWEB数据抽取
- Deep Web数据集成中的结果抽取及实体识别研究
- 随着Internet的发展和Web上信息的快速增加,人们越来越多地依赖搜索引擎来查找所需信息。目前的主流搜索引擎主要依靠爬虫爬行网页上的链接来抓取网页,因此基本上只索引了互联网上的静态页面,而Web上存在大量的在线数据库...
- 李石生
- 关键词:数据抽取
- 文献传递
- 基于DeepWeb的图书检索系统设计被引量:4
- 2008年
- 本文在介绍Deep Web集成系统结构、Deep Web资源的发现与分类、Deep Web查询接口模式抽取及集成、查询结果抽取与合并研究的基础上,提出了一个基于Deep Web的网上图书检索系统的设计方案,并对其中的关键问题给出了解决思路。
- 李石生刘海博赵耀
- 关键词:DEEPWEB信息抽取图书检索