您的位置: 专家智库 > >

刘佳宾

作品数:3 被引量:20H指数:2
供职机构:中国科学技术大学信息科学技术学院电子工程与信息科学系更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...
  • 1篇文化科学

主题

  • 2篇信息抽取
  • 2篇决策树
  • 2篇DOM树
  • 2篇抽取
  • 1篇中跨
  • 1篇数字图
  • 1篇数字图书馆
  • 1篇图书
  • 1篇图书馆
  • 1篇人工智能
  • 1篇自动提取方法
  • 1篇文摘
  • 1篇马尔可夫
  • 1篇马尔可夫链
  • 1篇模式识别
  • 1篇科技文摘
  • 1篇跨库检索
  • 1篇跨库检索系统
  • 1篇关键词
  • 1篇关键词抽取

机构

  • 3篇中国科学技术...

作者

  • 3篇刘佳宾
  • 2篇陈超
  • 2篇邵正荣
  • 1篇胡国平
  • 1篇吉翔华

传媒

  • 1篇计算机工程与...
  • 1篇中文信息学报

年份

  • 3篇2007
3 条 记 录,以下是 1-3
排序方式:
数字图书馆中跨库检索系统关键技术研究
随着Internet的迅猛发展,人们对高效率的信息获取技术的需要越来越迫切,对海量信息进行采集、分析、整理,得到高质量的分门别类的结构化信息,方便用户快捷地浏览查询,是极具现实意义的重大课题。 为适应广大师生教...
刘佳宾
关键词:信息抽取关键词抽取跨库检索系统DOM树数字图书馆
文献传递
基于机器学习的科技文摘关键词自动提取方法被引量:15
2007年
提出了一种基于机器学习的关键词自动抽取技术,主要是针对数字图书馆中的学术论文的摘要(Abstract)进行抽取。首次提出了以句子为基本抽取单位进行关键词抽取的思想。在提出关键词的候选词时采用n_grams方法和词性相结合的方法,在选取特征时考虑了词组的出现频率、词组在整个摘要中的位置、在所在句子中的位置和词组中单词的个数等特征。实验结果表明该方法能够适应各个领域的论文关键词提取,并且可以得到很好的效果。
刘佳宾陈超邵正荣吉翔华
关键词:决策树词性分析
基于决策树和马尔可夫链的问答对自动提取被引量:5
2007年
问答系统能用准确、简洁的答案回答用户用自然语言提出的问题,很明显系统中问答对的规模是影响问答系统最终性能的主要因素。为了提高问答对的规模、充分利用互联网资源,本文提出了一种基于决策树和马尔科夫链的在互联网上自动抽取问答对的算法。先根据网页中的HTML标记把网页表示成一棵DOM树;然后利用树中每个节点的结构和文字信息,抽取相应的特征;最后将得到的节点特征通过由决策树和一阶马尔可夫链结合得出的分类模型进行分类。试验结果表明准确率达到了90.398%,召回率达到了86.032%。对大量网页抽取的结果表明该分类模型能够适应对各种各样的网页的抽取。
刘佳宾胡国平陈超邵正荣
关键词:人工智能模式识别信息抽取DOM树决策树马尔可夫链
共1页<1>
聚类工具0