搜索到360篇“ 中文自动分词“的相关文章
- 基于深度学习的中文自动分词研究
- 2019年
- 传统机器学习分词的方法工作效率普遍偏低,因其基本依赖于人工设计的特征工程,且需要大量的人工验证特征的有效性。而基于神经网络深度学习算法出现后,实现了训练神经网络自动学习特征,这种方式极大减少工作量,同时提高提取特征工程的效率。本文根据一种基于长短时记忆神经网络与条件随机场模型结合的中文自动分词模型进行测试,结果表明分词准确率、召回率极高,更具通用性。
- 那勇李明全
- 关键词:中文分词
- 一种新的中文自动分词算法
- 一种新的中文自动分词算法,根据《分词词典》找到待分词句子中与词典中匹配的词,依据概率统计学,将待分词句子拆分成网状结构,给网状结构每条边赋予权值,找出权值最大的路径即为待分词句子的分词结果。本发明中文预处理的速度较基于分...
- 金平艳
- 一种改进的中文自动分词算法
- 一种改进的中文自动分词算法,将待分词句子和已经初始化成功的语料库中的词进行对比匹配,根据概率统计学,将待分词句子拆分为网状结构,将网状结构的每条边都赋予一定的权值,其中权值最大的路径便是最终的分词结果,最后将验证分词结果...
- 金平艳胡成华
- 一种基于信息论的中文自动分词算法
- 一种基于信息论的中文自动分词算法,将待分词句子和已经初始化成功的语料库中的词进行对比匹配,根据概率统计学,将待分词句子拆分为网状结构,利用信息论方法求解网状结构中每条边的权值,权重最大的一条路径,即为待分词句子的分词结果...
- 金平艳胡成华
- 基于DRIS系统中的中文自动分词模块设计与实现被引量:1
- 2016年
- 随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自动分词模块。通过算法的比对,选择了正向匹配算法作为该模块的基本算法,对其文件结构,中文词典初始化及识别处理过程做出详细介绍。经后期使用后可比较出该模块在检索效率与服务质量上都有了很大程度上的提高,达到了设计要求。
- 张昭楠马亚蕾
- 关键词:中文自动分词搜索引擎
- 中文自动分词技术的改进与优化研究
- 中文自动分词技术是中文信息处理领域中一项重要的基础性课题,它对相关领域(如信息抽取、全文检索、数据挖掘、机器翻译、问答系统等领域)的研究有着巨大的推动作用。本文对中文自动分词领域涉及的主要技术进行了比较全面和仔细的研究,...
- 张金龙
- 关键词:中文自动分词机构名识别命名实体识别搜索引擎词典结构
- 自然语言处理中的中文自动分词技术被引量:1
- 2012年
- 中文自动分词技术是自然语言处理领域一项很重要的基础工作,随着信息的几何级增长,对目前的分词方法提出了更高要求。本文说明了自动分词中存在的两个最大困难和解决方法。对各种分词算法进行介绍,并对各种算法进行比较与讨论。
- 迪丽达尔.迪力沙提
- 关键词:自动分词分词方法未登录词
- 中文自动分词在期刊论文检索中的应用
- 2012年
- 从中文分词算法的现状入手,分析了传统分析算法的缺点以及原因,在此基础上,提出了前馈控制的定义、控制思想的形成和控制策略,并在最后从空间和时间角度分析了这种思想的可行性。
- 张波
- 关键词:中文分词前馈控制期刊论文
- 国内中文自动分词技术研究综述被引量:106
- 2011年
- 认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
- 奉国和郑伟
- 关键词:中文分词分词算法歧义消除未登录词分词系统
- 中文自动分词及人名识别技术研究
- 在Internet日益普及的今天,语言文字作为信息的载体越来越多的出现在人们的视野中,因此自然语言理解成为了一个热门的研究领域。中文自动分词作为自然语言理解的第一步,分词技术的优劣将直接影响到中文信息的后续处理。它是自然...
- 蒋才智
- 关键词:自然语言理解中文自动分词中文人名识别朴素贝叶斯
相关作者
- 曲维光

- 作品数:103被引量:399H指数:13
- 供职机构:南京师范大学
- 研究主题:语义表示 语料库 中文 神经网络 AMR
- 丁德鑫

- 作品数:6被引量:21H指数:2
- 供职机构:南京师范大学计算机科学与技术学院
- 研究主题:中文自动分词 歧义消解 词义消歧 中文信息处理 条件随机场
- 苗文彦

- 作品数:3被引量:1H指数:1
- 供职机构:哈尔滨工业大学
- 研究主题:机器翻译 中文自动分词 切分方法
- 江耿豪

- 作品数:27被引量:46H指数:3
- 供职机构:韩山师范学院
- 研究主题:编程 游戏 教学改革 教学模式 相似度计算
- 欧振猛

- 作品数:15被引量:55H指数:1
- 供职机构:中国电信股份有限公司
- 研究主题:中文自动分词 搜索引擎 策略表 光线路终端 功耗