您的位置: 专家智库 > >

恽佳丽

作品数:4 被引量:7H指数:1
供职机构:北京交通大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 4篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇语料
  • 2篇语料库
  • 2篇数据挖掘
  • 2篇统计学
  • 2篇聚类
  • 2篇基于语料
  • 2篇基于语料库
  • 2篇抽取
  • 2篇抽取算法
  • 1篇语义相关
  • 1篇语义相关性
  • 1篇知识表示
  • 1篇特征聚类
  • 1篇主题模型
  • 1篇文本
  • 1篇文本聚类
  • 1篇文本挖掘
  • 1篇领域知识
  • 1篇WIKIPE...

机构

  • 4篇北京交通大学

作者

  • 4篇恽佳丽
  • 2篇何军
  • 2篇黄厚宽
  • 1篇景丽萍
  • 1篇于剑

传媒

  • 1篇计算机工程与...
  • 1篇北京交通大学...

年份

  • 1篇2011
  • 1篇2010
  • 2篇2009
4 条 记 录,以下是 1-4
排序方式:
基于语料库的多词单位抽取算法
2009年
分析了研究者们在多词单位抽取算法中的一些工作,包括多词单位的评分和选择.将评分算法根据它们的设计依据划分为3类,对它们进行总结分析,并用实验进行了验证.本文还分析了多种评分算法的组合方法,使用这些组合方法可以互补各种评分算法,达到更好的抽取效果.
恽佳丽何军黄厚宽
关键词:语料库统计学抽取算法数据挖掘
基于Wikipedia的文本表示模型及其在文本挖掘中的应用
随着计算机和网络技术的发展,可用的信息数量在不断增长。为了能够快速准确地获取信息,研究者们开发了很多有效的算法。这些算法主要针对结构化的数据,而事实上可获取的大部分信息都存储在非结构化的文本数据中。通过文本表示,可以将非...
恽佳丽
关键词:文本挖掘特征聚类主题模型语义相关性
领域知识在文本聚类应用中的机遇和挑战被引量:7
2010年
最近几年,越来越多学者意识到单靠数据驱动的无监督聚类方法很难满足用户对富含语义信息的文本数据的处理需求。领域知识,如领域本体的人工或自动构建、百科全书Wikipedia的网上公布为文本处理带来了新的希望和美好的前景。本文主要阐述领域知识在文本聚类过程中的具体应用、研究现状和所面临的挑战。
景丽萍恽佳丽于剑
关键词:领域知识文本聚类知识表示
基于语料库的多词单位抽取方法研究
多词单位是由两个或多个单词组成的独立的语义单位。多词单位的发现和使用在词典编纂、语言翻译和信息检索等领域有着重要的作用。发现多词单位的主要途径是从语料库中进行抽取。目前已经出现了很多从语料库中抽取多词单位的研究。抽取方法...
恽佳丽黄厚宽何军
关键词:语料库统计学抽取算法数据挖掘
共1页<1>
聚类工具0