您的位置: 专家智库 > >

刘博

作品数:1 被引量:7H指数:1
供职机构:山西大学计算机与信息技术学院更多>>
发文基金:山西省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇语料
  • 1篇语料库加工
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇规则与统计相...
  • 1篇分词
  • 1篇大规模语料
  • 1篇大规模语料库

机构

  • 1篇山西大学

作者

  • 1篇郑家恒
  • 1篇张虎
  • 1篇刘博

传媒

  • 1篇计算机工程与...

年份

  • 1篇2008
1 条 记 录,以下是 1-1
排序方式:
规则与统计相结合的分词一致性检验被引量:7
2008年
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
刘博郑家恒张虎
关键词:中文信息处理大规模语料库分词语料库加工
共1页<1>
聚类工具0