您的位置: 专家智库 > >

詹志建

作品数:6 被引量:47H指数:3
供职机构:中国人民大学信息学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学经济管理更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 6篇自动化与计算...
  • 1篇经济管理
  • 1篇文化科学

主题

  • 4篇网络
  • 3篇相似度
  • 2篇语言网络
  • 2篇相似度计算
  • 2篇词语相似度
  • 1篇短文
  • 1篇信息提取
  • 1篇信息系统
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇语义相似度计...
  • 1篇语义信息
  • 1篇数据抽取
  • 1篇自适
  • 1篇自适应
  • 1篇自适应查询
  • 1篇网络查询
  • 1篇网页
  • 1篇网页解析
  • 1篇文本

机构

  • 6篇中国人民大学

作者

  • 6篇詹志建
  • 3篇杨小平
  • 2篇杨禹
  • 1篇张力
  • 1篇梁丽娜

传媒

  • 2篇中国计算机用...
  • 1篇计算机工程与...
  • 1篇中文信息学报
  • 1篇计算机科学

年份

  • 1篇2016
  • 1篇2014
  • 1篇2013
  • 3篇2008
6 条 记 录,以下是 1-6
排序方式:
基于百度百科的词语相似度计算被引量:22
2013年
词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题。传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库。提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度。实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理。
詹志建梁丽娜杨小平
关键词:词语相似度语言网络百度百科向量空间模型
无结构P2P环境下自适应查询存储优化
无结构P2P环境下资源发现一直是P2P研究的热点.Tsoumakos D和Roussopoulos N提出一种基于概率的搜索方式:Adaptive Probabilistic Search,这种方式可以有效减少网络传输信...
杨禹詹志建张力
关键词:网络查询自适应查询
文献传递
基于Hidden Web的数据抽取研究与应用
随着Web的迅速发展和普及,可以获取信息的种类和结构日益丰富,从传统关系数据库到分布于Web上的大量半结构化信息,以及日益增多的HiddenWeb数据信息。如何实现基于Web的分布式信息的动态数据抽取,使用户能够高效、透...
詹志建
关键词:数据抽取网页解析信息提取
一种基于复杂网络的短文本语义相似度计算被引量:14
2016年
将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立复杂网络模型,计算短文本词语的复杂网络特征值,再借助外部工具计算短文本词语之间的语义相似度,然后结合短文本语义相似度定义计算短文本之间的相似度。最后在基准数据集上进行聚类实验,验证本文提出的短文本相似度计算方法在基于F-度量值标准上,优于传统的TF-IDF方法和另一种基于词项语义相似度的计算方法。
詹志建杨小平
关键词:复杂网络语义相似度
基于语言网络和语义信息的文本相似度计算被引量:11
2014年
通过分析已有的基于统计和基于语义分析的文本相似性度量方法的不足,提出了一种新的基于语言网络和词项语义信息的文本相似度计算方法。对文本建立语言网络,计算网络节点综合特征值,选取TOP比例特征词表征文本,有效降低文本表示维度。计算TOP比例特征词间的相似度,以及这些词的综合特征值所占百分比以计算文本之间的相似度。利用提出的相似度计算方法在数据集上进行聚类实验,实验结果表明,提出的文本相似度计算方法,在F-度量值标准上优于传统的TF-IDF方法以及另一种基于词项语义信息的相似度量方法。
詹志建杨小平
关键词:语言网络文本聚类文本相似度词语相似度
自助游平台开发架构研究
随着互联网的迅速发展,网络应用需求日益增强.网络应用平台大量涌现,博客、社区、SNS、视频等都对网络发展产生深远的影响。现在几乎所有的网络应用都在探索和建立自己的应用平台,并积极创新,不断提出细分的更适合目标用户的新观念...
詹志建杨禹
关键词:旅游业信息系统
文献传递
共1页<1>
聚类工具0