曾华琳
- 作品数:25 被引量:73H指数:3
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 一个统计与规则相结合的中文命名实体识别系统
- 文章介绍了一个中文命名实体识别系统,该系统采用了统计与规则相结合的方法。整个识别过程主要分成两个步骤,首先使用隐马尔可夫模型进行词性标注,然后利用具有优先级别的匹配规则对第一步的结果进行修正和转换。同时,系统还对上下文相...
- 向晓雯史晓东曾华琳
- 关键词:隐马尔可夫模型
- 文献传递
- 对话篇章解析方法
- 本发明公开了一种对话篇章解析方法、介质和设备,其中方法包括:获取历史对话信息,并对历史对话信息进行预处理,以生成初始训练样本;根据初始训练样本生成第一训练样本和第二训练样本;根据第一训练样本进行模型训练,以得到结构自感知...
- 苏劲松王安特曾华琳
- 文献传递
- 本科生参与智能机器人科研探索
- 提出本科学生是否能够尽早进入实验室进行智能机器人相关研究的问题,分析从动员到项目执行等多方面因素的影响,阐述智能科学专业的本科学生进行科研项目的相关经验。
- 曾华琳郑旭玲晁飞陈毅东李绍滋
- 关键词:本科生科研智能机器人教学智能科学与技术
- 融入迭代式句对关系预测的图神经网络句子排序方法
- 本发明公开了一种融入迭代式句对关系预测的图神经网络句子排序方法和介质,其中方法包括:构建句子实体图;通过初始句对顺序分类器对所述句子实体图进行分析,以预测所述句子实体图中相连句对的顺序;根据所述句子实体图中相连句对的顺序...
- 苏劲松沈黄隽赖少鹏曾华琳
- 文献传递
- 一种基于提取上下文信息的分词算法被引量:16
- 2005年
- 汉语分词在汉语文本处理过程中是一个特殊而重要的组成部分。传统的基于词典的分词算法存在很大的缺陷,无法对未登录词进行很好的处理。基于概率的算法只考虑了训练集语料的概率模型,对于不同领域的文本的处理不尽如人意。文章提出一种基于上下文信息提取的概率分词算法,能够将切分文本的上下文信息加入到分词概率模型中,以指导文本的切分。这种切分算法结合经典n元模型以及EM算法,在封闭和开放测试环境中分别取得了比较好的效果。
- 曾华琳李堂秋史晓东
- 关键词:中文分词N元模型上下文信息
- 基于译文树结构解码路径动态选择的机器翻译方法
- 本发明公开了一种基于译文树结构解码路径动态选择的机器翻译方法和介质,其中方法包括:获取人工标注的机器翻译数据;对目标语言句子进行解析,以得到该目标语言句子对应的目标语言成分句法树,并根据源语言句子和对应的目标语言成分句法...
- 苏劲松蒋辉王志豪曾华琳
- 基于抽象语法树结构信息增强的代码生成方法
- 本发明公开了一种基于抽象语法树结构信息增强的代码生成方法和介质,其中方法包括:获取人工标注的代码生成数据,其中,代码生成数据包括自然语言句子和对应的目标代码;采用解析器对目标代码进行解析,以得到目标代码对应的抽象语法树,...
- 苏劲松蒋辉曾华琳
- 一种反射式双传感器相机
- 一种反射式双传感器相机,包括镜头、可调反光镜、转轴和传感器;所述镜头由多片透镜组成;所述可调反光镜设于相机内且位于镜头的后端;所述转轴与可调反光镜固定连接,转轴的一端露出于相机壳,转轴的另一端与相机壳内壁转动连接,以使可...
- 刘俊源曾华琳
- 基于上下文信息提取的概率分词算法
- 2006年
- 汉语分词在汉语文本处理过程中是一个十分特殊而重要的组成部分。传统的基于词典的分词算法存在着很大的缺陷,它们无法对未登陆词进行很好的处理。而基于概率的算法只考虑了训练集语料的概率模型,对于不同领域的文本的处理效果不尽人意。本文提出了一种基于上下文信息提取的概率分词算法,它能够将预切分文本的上下文信息加入分词概率模型中,以上下文信息指导文本的切分。这种切分算法结合经典n元模型以及EM算法,在开放测试环境中取得了比较好的效果。
- 曾华琳李堂秋
- 关键词:中文分词N元模型上下文信息
- 一个统计与规则相结合的中文命名实体识别系统被引量:45
- 2005年
- 介绍了一个中文命名实体识别系统,该系统采用了统计与规则相结合的方法。整个识别过程主要分成两个步骤,首先使用隐马尔可夫模型进行词性标注,然后利用具有优先级别的匹配规则对第一步的结果进行修正和转换。同时,系统还对上下文相关的命名实体识别作了初步的尝试。在863组织的命名实体识别评测中,系统的准确率、召回率和F值分别达到了81.93%,78.20%,80.02%。
- 向晓雯史晓东曾华琳
- 关键词:隐马尔可夫模型