您的位置: 专家智库 > >

易江燕

作品数:3 被引量:2H指数:1
供职机构:中国社会科学院更多>>
发文基金:国家重点基础研究发展计划更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 2篇文化科学
  • 1篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇语料
  • 1篇语料库
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇网络
  • 1篇网络信息
  • 1篇教育
  • 1篇教育热点
  • 1篇计算机
  • 1篇计算机应用
  • 1篇跟踪技术

机构

  • 2篇中国社会科学...
  • 2篇语言文字应用...
  • 1篇云南师范大学
  • 1篇微软公司

作者

  • 3篇易江燕
  • 2篇靳光瑾
  • 1篇李玉梅
  • 1篇甘健侯
  • 1篇姜自霞
  • 1篇黄昌宁
  • 1篇陈晓

传媒

  • 1篇中文信息学报
  • 1篇2009教育...

年份

  • 1篇2010
  • 1篇2009
  • 1篇2007
3 条 记 录,以下是 1-3
排序方式:
话题自动发现与跟踪技术研究综述
话题自动发现与跟踪技术TDT,能自动地将分散的网络信息高效地搜集起来并加以整理分析,从而帮助人们及时了解一个话题的全部细节以及该话题的发展脉络。该技术具有重大的实用价值和现实意义。本文简要介绍了该技术的研究背景、TDT国...
易江燕靳光瑾甘健侯
关键词:网络信息
文献传递
分词规范亟需补充的三方面内容被引量:2
2007年
本文认为,为提高语料库的分词标注质量应在分词规范中补充三个内容:①命名实体(人名、地名、机构名)标注细则;②表义字串(日期、时间、百分数等)标注细则;③歧义字串的消解细则。因为一方面命名实体和表义字串已被不少分词语料库视为分词单位,另一方面在以往的分词规范中几乎从不谈及歧义消解问题。其实人们对歧义字串的语感往往是不同的。因此有必要在规范中对典型的歧义字串予以说明。实践表明,在规范中交待清楚以上三方面内容,就可以在很大程度上避免标注的错误和不一致性。
李玉梅陈晓姜自霞易江燕靳光瑾黄昌宁
关键词:计算机应用中文信息处理语料库
教育热点话题自动发现技术研究
本文研究如何发现热点话题,并将该技术应用于教育领域,在大规模的教育新闻网页中发现教育热点话题。在研究过程中,不仅采用统计方法,而且利用语言学知识辅助研究。首先,本文采用向量空间模型表示报道或话题,提出用标题和正文两个向量...
易江燕
共1页<1>
聚类工具0