您的位置: 专家智库 > >

刘海博

作品数:12 被引量:46H指数:4
供职机构:河北大学更多>>
发文基金:国家自然科学基金河北省教育厅科研基金河北省科技攻关计划更多>>
相关领域:自动化与计算机技术文化科学电子电信更多>>

文献类型

  • 8篇期刊文章
  • 2篇科技成果
  • 1篇学位论文
  • 1篇会议论文

领域

  • 8篇自动化与计算...
  • 3篇文化科学
  • 1篇电子电信

主题

  • 3篇WEB
  • 3篇DEEP
  • 3篇抽取
  • 2篇图书
  • 2篇基于网络
  • 2篇基于网络环境
  • 2篇DEEP_W...
  • 1篇大型仪器
  • 1篇信息抽取
  • 1篇信息管理
  • 1篇信息管理系统
  • 1篇移动通信
  • 1篇移动通信网
  • 1篇移动通信网络
  • 1篇用户
  • 1篇日志
  • 1篇视觉文档图像
  • 1篇数据仓库
  • 1篇数据抽取
  • 1篇数字图

机构

  • 12篇河北大学
  • 1篇河北农业大学
  • 1篇河北省气象技...

作者

  • 12篇刘海博
  • 5篇袁方
  • 2篇宋鑫
  • 2篇王亮
  • 2篇李石生
  • 2篇赵耀
  • 1篇郭玉琴
  • 1篇刘宇
  • 1篇董国义
  • 1篇郄亚辉
  • 1篇郗亚辉
  • 1篇张瑜
  • 1篇张瑜
  • 1篇田学东
  • 1篇路小英
  • 1篇周旭
  • 1篇高相辉
  • 1篇翟俊海
  • 1篇陈昊
  • 1篇王煜

传媒

  • 1篇河北大学学报...
  • 1篇江西师范大学...
  • 1篇广西师范大学...
  • 1篇计算机应用
  • 1篇实验技术与管...
  • 1篇河北大学成人...
  • 1篇Journa...
  • 1篇科技信息

年份

  • 1篇2013
  • 1篇2010
  • 5篇2008
  • 4篇2007
  • 1篇2005
12 条 记 录,以下是 1-10
排序方式:
一种基于XML的数字图书馆日志标准
记录和日志分析是改进和提高数字图书馆系统服务的一个好途径。本文提出了一个基于XML的日志标准,可以捕获丰富、详细的系统和用户行为信息。该日志标准以一个通用的日志组件工具采实现,可以插入到任何数字图书馆系统。
宋鑫袁方刘海博张瑜
关键词:XML技术数字图书馆
基于网络环境的大型仪器设备协作系统被引量:6
2010年
针对大型仪器设备管理中存在着重复购置、设备闲置及供需信息不对称等问题,设计开发了基于网络环境的大型仪器设备协作系统,该系统将设备信息在网上发布,使用者可以通过网络申请和预约,最大限度地实现了大型仪器设备资源的多用户共享使用。
刘海博梁燕华
关键词:网络环境资源共享
视觉文档图像的几何校正被引量:13
2007年
在以数码相机等数字设备拍摄文档资料时,所拍摄的图像经常会产生各种各样的几何变形,这种变形可能会导致识别软件中的版面分析和切分算法失效,从而使文档图像无法被识别。为了使普通的识别软件能够对数码相机等拍摄的文档图像进行识别,有必要对其进行几何校正。根据几何变形产生的原因对其进行了分类,并针对不同种类的变形提出了相应的校正算法。实验结果证明该分类方法和相应校正算法都有较好的效果。
田学东马兴杰韩磊刘海博
关键词:OCR视觉文档图像
基于数据仓库的移动通信网络优化研究
通信行业竞争日益激烈,如何通过对现有历史数据的分析,提高网络资源的利用率,制定切实有效的业务政策来指导企业合理分配资源、提高服务质量,是通信行业决策者亟需解决的问题。数据仓库是近年来兴起的一种新的数据库应用技术,它支持管...
刘海博
关键词:数据仓库联机分析处理移动通信网络优化
文献传递
Text categorization based on fuzzy classification rules tree被引量:4
2008年
To deal with the problem that arises when the conventional fuzzy class-association method applies repetitive scans of the classifier to classify new texts,which has low efficiency, a new approach based on the FCR-tree(fuzzy classification rules tree)for text categorization is proposed.The compactness of the FCR-tree saves significant space in storing a large set of rules when there are many repeated words in the rules.In comparison with classification rules,the fuzzy classification rules contain not only words,but also the fuzzy sets corresponding to the frequencies of words appearing in texts.Therefore,the construction of an FCR-tree and its structure are different from a CR-tree.To debase the difficulty of FCR-tree construction and rules retrieval,more k-FCR-trees are built.When classifying a new text,it is not necessary to search the paths of the sub-trees led by those words not appearing in this text,thus reducing the number of traveling rules.Experimental results show that the proposed approach obviously outperforms the conventional method in efficiency.
郭玉琴袁方刘海博
用聚类-分类模式解决聚类问题被引量:8
2007年
分类和聚类都是常用的数据挖掘方法,分类的优点是准确率较高,但需要带有类别标注的训练集;聚类不需要训练集,但准确率较低。提出一种聚类-分类模式来解决聚类问题,首先通过聚类方法自动形成训练集,然后在训练集的基础上进行分类操作。实验数据表明,提出的聚类-分类模式能够有效提高聚类的准确率。
周志勇袁方刘海博
关键词:聚类算法
Deep Web资源集成研究被引量:1
2007年
面对越来越多的在线数据库,Deep Web得到人们的广泛重视,Deep Web资源集成是Deep Web研究的重点内容。本文对一个典型的Deep Web资源集成原型系统--WISE-Integrator进行了系统的分析和介绍。该系统对查询接口的描述、接口抽取和接口整合等Deep Web资源集成的主要问题进行了深入的研究,提出一些切实可行的方法,对于该领域的研究人员具有重要的参考价值。
周旭赵耀刘海博
关键词:DEEPWEB查询接口抽取
基于网络环境的高校科研信息综合管理系统
袁方董国义郄亚辉秦向东高相辉张明陈昊刘海博齐琳
该项目深入研究了高校科研管理模式,利用计算机技术、财贸系统技术、数据库技术等实现了高校科研管理的科学化和自动化,实现了对科研信息的编辑、查询、统计、备份、恢复、打印、数据、经费处理、系统设置及信息发布、内部办公、后台管理...
关键词:
关键词:科研管理信息管理系统
用于文本分类的快速KNN算法被引量:8
2008年
KNN(k Nearest Neighbor)算法是一种简单、有效、非参数的文本分类方法.传统的KNN方法有着样本相似度计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性.提出了一种快速查找精确的k个最近邻的TKNN(Tree-k-Nearest-Neighbor)算法,该算法建立一棵用于查找的树,加速k个最近邻的查找.首先以整个样本集合中心为基准,按照距离中心的距离将所有样本进行排序,并等分L组,作为根结点的孩子,每个孩子以同样方式处理,直到每组样本数量在[k,2k]间为止.根据这棵树查找k个最近邻,减小了查找范围,极大地降低了相似度计算量.
刘海博郗亚辉王煜
关键词:KNN文本分类相似度
基于探测查询的Deep Web实体识别被引量:1
2008年
目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.
李石生刘海博路小英王亮
关键词:DEEPWEB数据抽取
共2页<12>
聚类工具0