张桂林
- 作品数:2 被引量:19H指数:2
- 供职机构:吉林大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金“十一五”国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文文本自动分类系统的研究与实现
- 本文的第一章介绍了自动文本分类技术的产生背景及其意义,介绍了自动文本分类的问题描述、评价方法以及技术的种类,并在最后部分介绍了国外该技术的研究现状。 第二章介绍了中文文本自动分类的技术基础。 第三章介绍了文本分类的关键技...
- 张桂林
- 关键词:文本分类中文分词向量空间模型
- 文献传递
- 中文文本分类相关算法的研究与实现被引量:14
- 2009年
- 通过对分词歧义处理情况的分析,提出一种基于上下文的双向扫描分词算法,对分词词典进行改进,将词组短语的固定搭配引入词典中.讨论了特征项的选择及权重的设定,并引进2χ统计量参与项的权值计算,解决了目前通用TF-IDF加权法的不足,同时提出了项打分分类算法,提高了特征项对于文本分类的有效性.实验结果表明,改进后的权重计算方法性能更优越.
- 徐沛娟李雄飞惠玥张桂林
- 关键词:文本分类向量空间模型