您的位置: 专家智库 > >

程洁

作品数:2 被引量:2H指数:1
供职机构:中国科学院计算机网络信息中心更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇聚类
  • 1篇文本聚类
  • 1篇问答系统
  • 1篇WORDNE...
  • 1篇MEANS
  • 1篇词性
  • 1篇词性标注

机构

  • 2篇中国科学院
  • 1篇中国科学院研...
  • 1篇中国科学院文...

作者

  • 2篇饶洋辉
  • 2篇叶良
  • 2篇程洁
  • 1篇常红旭

传媒

  • 1篇图书馆杂志
  • 1篇现代图书情报...

年份

  • 2篇2009
2 条 记 录,以下是 1-2
排序方式:
WordNet在文本聚类中的应用研究被引量:2
2009年
针对文本聚类算法在应用方面存在的"维灾"、簇的命名以及大规模的问题,运用WordNet词典进行词列表的降维和词干化,提出并实现基于词性标注和WordNet相结合的并行文本聚类方法,最后和基于Porter词干化的文本聚类方法进行性能的比较。实验结果表明,该方法能大幅度降低词列表的维度,提高聚类的准确率和召回率,同时增强各个簇的可理解性。
饶洋辉叶良程洁
关键词:WORDNET词性标注文本聚类
新话题监测研究进展
2009年
新话题监测是话题检测与跟踪领域的一项重要研究。对于事件层的新话题监测,主要阐述基于聚类的方法,包括文档的向量化表示以及文档聚类。对于句子层的新话题监测,重点介绍基于问答系统的方法,包括问题表述与预处理、相关句子检索以及新颖句子检测。并对新话题监测研究存在的问题及其发展趋势进行了探讨。
饶洋辉叶良常红旭程洁
关键词:聚类问答系统
共1页<1>
聚类工具0