河北省教育厅科研基金(2004406)
- 作品数:10 被引量:260H指数:6
- 相关作者:袁方周志勇刘博杨柳刘海博更多>>
- 相关机构:河北大学河北农业大学保定金融高等专科学校更多>>
- 发文基金:河北省教育厅科研基金河北省科技攻关计划保定市科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- Jena推理机在基于本体的信息检索中的应用被引量:34
- 2005年
- 对Jean推理机的结构及推理规则的构造语法进行系统介绍,通过实例说明Jena在基于 本体的信息检索中的应用。
- 耿科明袁方
- 关键词:本体JENAOWLRDF信息检索推理机
- 初始聚类中心优化的k-means算法被引量:174
- 2007年
- 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。
- 袁方周志勇宋鑫
- 关键词:数据挖掘聚类K-MEANS算法聚类中心
- 基于Ontology的智能信息检索研究被引量:10
- 2005年
- 在介绍Ontology的基本概念及Ontology在信息检索中的应用前提下,提出了一个基于Ontolo-gy的智能信息检索设计方案.利用Ontology中规范的概念及概念之间明确的关系描述,使信息检索过程更加智能化.
- 张明王煜杨敬伟袁方赵红石强
- 关键词:ONTOLOGY智能信息检索XML
- 改进的KNN方法及其在中文文本分类中的应用被引量:10
- 2008年
- 介绍了基于KNN方法的中文文本分类流程及相关技术,在分析传统KNN方法不足的基础上提出一种改进的KNN方法。该方法在特征选取、权值确定、相似度计算等方面进行了改进,并给出了优化措施。实验表明:与传统的KNN方法相比,改进后的KNN方法在保证分类准确率的同时,使分类效率得到了有效提高。
- 刘博杨柳袁方
- 关键词:文本分类KNN特征选取相似度
- 商务元搜索引擎中域语义映射问题研究被引量:1
- 2007年
- 电子商务元搜索引擎系统将出售相同产品的多个电子商务引擎界面集成在一起,提供统一的访问接口,给用户的访问和产品的比较提供了极大的方便。当涉及的产品域太多时,需要添加一个域映射模块,将用户的常规查询映射到正确的域上。本文采用本体作为信息的组织形式,不但提高了查询的相关性,而且可以扩充涉及的产品域;并且提供了一个记忆模型,提高频繁查找的效率。
- 陈向阳袁方
- 关键词:本体记忆模型
- 用聚类-分类模式解决聚类问题被引量:8
- 2007年
- 分类和聚类都是常用的数据挖掘方法,分类的优点是准确率较高,但需要带有类别标注的训练集;聚类不需要训练集,但准确率较低。提出一种聚类-分类模式来解决聚类问题,首先通过聚类方法自动形成训练集,然后在训练集的基础上进行分类操作。实验数据表明,提出的聚类-分类模式能够有效提高聚类的准确率。
- 周志勇袁方刘海博
- 关键词:聚类算法
- 基于本体的推理机研究被引量:19
- 2006年
- 语义网技术的兴起促进了本体技术的发展,本体作为语义网的基石,在知识表示与知识推理方面发挥着重要作用。本体表示语言与描述逻辑相结合,为本体推理的合理性和有效性提供了保证。介绍了本体语言、描述逻辑和描述逻辑推理的基本原理,重点介绍了基于SHIQ描述逻辑的推理机Racer的基本功能及其在智能信息检索中的应用。
- 袁方王涛
- 关键词:本体描述逻辑推理机
- 基于探测查询的Deep Web实体识别被引量:1
- 2008年
- 目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.
- 李石生刘海博路小英王亮
- 关键词:DEEPWEB数据抽取
- 一种基于类别核心词的概念映射方法被引量:3
- 2007年
- 由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高。近几年,基于概念的文本分类方法得到人们的重视。在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助《知网》将特征词映射到基于类别核心词的概念空间,然后在概念空间上完成文本分类工作。实验结果表明,基于类别核心词的概念映射方法及相应的基于概念的文本分类能够有效提高文本分类的精度。
- 苑俊英袁方刘博
- 关键词:文本分类《知网》
- 基于渐进式丰富词典的分词方法研究被引量:1
- 2006年
- 由于现代社会飞速发展,一些新的名词不断出现,在已有的字符串匹配的分词方法中,大部分的词典是固定的,如果出现新的词,那么就不能被正确识别出来。由此该文提出了渐进式丰富词典的分词方法,把那些不能正确分出来的字符串,利用统计词频的方法记录下来,如果词频达到一定阈值,就可以把它认为是新词,可以把它加入到词典中,使得词典动态的增加。实验证明,该方法在保证分词速度不受影响的基础上,可以提高分词的精度。
- 杨柳袁方霍亮