王慰
- 作品数:1 被引量:11H指数:1
- 供职机构:长江科学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文分词技术及其实现被引量:11
- 2011年
- 为了实现个性化的主动信息服务,网络信息挖掘(Web Mining)技术成为近年来一个新的研究课题。挖掘通常涉及输入文本的处理过程,中文分词是中文信息处理的基础,汉语文本基于单字,汉语的书面表达方式也是以汉字作为最小单位,词与词之间没有显性的分界标志,中文分词的准确与否,常常直接影响到对搜索结果的相关度排序,因此分词成为汉语文本分析处理中首要解决的问题。就中文分词技术进行讨论,并以2-gram模型为例,研究用JA-VA实现中文分词的过程。
- 付年钧彭昌水王慰
- 关键词:中文分词文本处理信息挖掘N-GRAM模型JAVA