李堂秋
- 作品数:46 被引量:223H指数:9
- 供职机构:厦门大学信息科学与技术学院计算机科学系更多>>
- 发文基金:国家高技术研究发展计划福建省科技计划重点项目福建省科技重点项目更多>>
- 相关领域:自动化与计算机技术语言文字生物学文化科学更多>>
- 汉英机器翻译系统中的一种词义排歧方法
- 本文论述了一种基于中间语言的机器翻译的词汇排歧方法.该方法从大规模未标注文本中获取词语义原的同现集合,并以此为参考成生义原的语义限制规则,对机器翻译的分析阶段产生的中间语言中进行词义排歧.文章首先提出了这种方法的总体思路...
- 杨晓峰李堂秋洪青阳
- 关键词:词义排歧机器翻译中间语言相似度知网
- 汉英机器翻译中疑问句疑问信息的分析研究被引量:5
- 2001年
- 汉语的疑问句的提问信息分布于句中,不像英语那样是置于句首的,因此汉语疑问句的关键提问信息(即疑问点)的分析就成为我们需研究的主要问题。首先总结了汉语疑问句疑问结构的类型,然后提出了采用上下文无关的合一规则作为分析手段的总体思路,并针对疑问结构的各类型给出相应的分析规则及算法。实验证明本文提出的分析策略具有较好的处理效果。
- 杨晓峰李堂秋洪青阳
- 关键词:汉英机器翻译疑问句专家系统
- 一种基于向量空间模型文本分类系统的研究与设计
- 分类是在给定的分类体系下,根据文本的内容自动确定文本类别的过程.本文阐述了一个基于向量空间模型的文本分类系统的研究与设计.对文本分类系统的系统结构、预处理、特征提取、分类算法等进行了详细的介绍.分类粒度的选择上,在基于词...
- 李长虹李堂秋
- 关键词:文本分类向量空间模型互信息量
- 机器辅助翻译系统用词典的管理
- 本文从一个机器辅助翻译系统出发,采用分层次的多级索引结构,构造了一个具有综合作用的词典,由系统词典和用户词典组成,该词典的使用穿插于整个系统的使用,在实际的使用过程中发挥了较高的效率。文章详细阐述了构造词典的整个过程。
- 曾华琳李堂秋曹冬林
- 关键词:人工智能机器翻译词典索引
- 文献传递
- 基于词汇链的文本过滤模型被引量:18
- 2003年
- 在介绍文本过滤的背景及传统基于关键词的向量空间方法不足之处的同时,引入了词汇链的概念,提出了基于词汇链表示文本的文本过滤模型,该模型首先对文本进行分析,把文本表示成词汇链的形式,在形成用户初始模板之后,以此模板来进行文本过滤。在用户反馈的基础上,自适应地修改该模板,以适应用户变化的需求及改善系统过滤性能,实验表明,这样的确可以提高系统精度。
- 尤文建李绍滋李堂秋
- 关键词:词汇链向量空间用户模板文本表示WORDNET
- 机器辅助翻译系统用词典的构造与管理
- 从一个机器辅助翻译系统出发,采用分层次的多级索引结构,构造了一个具有综合作用的词典,由系统词典和用户词典组成,该词典的使用穿插于整个系统的使用,在实际的使用过程中发挥了较高的效率.文章详细阐述了构造词典的整个过程.
- 曾华琳李堂秋曹冬林
- 关键词:人工智能词典索引
- 汉英翻译系统英文生成中选词模型的设计被引量:5
- 2001年
- 本文描述了一种基于实例比较 ,辅以语义模式匹配的英文选词模型的设计。首先 ,我们讨论了汉英翻译系统英文生成中选词的重要性 ,然后比较了几种可能的选词策略并提出我们的选词模型 ,接着我们较详细地描述了生成词典的结构以及选词算法。文中 ,我们还简要介绍了我们所使用的语义知识资源———《知网》
- 陈毅东李堂秋洪青阳郑旭玲
- 关键词:语义模式知网机器翻译选词策略
- 基于有向图的FIRST集合求解算法
- 1998年
- 引入文法的首符集图概念,据此提出一种求解上下文无文法FIRST集合的有效算法.
- 卢伟李堂秋
- 关键词:数据结构有向图
- 基于上下文信息提取的概率分词算法
- 汉语分词在汉语文本处理过程中是一个十分特殊而重要的组成部分。传统的基于词典的分词算法存在着很大的缺陷,它们无法对未登陆词进行很好的处理。而基于概率的算法只考虑了训练集语料的概率模型,对于不同领域的文本的处理效果不尽人意。...
- 曾华琳史晓东李堂秋
- 关键词:中文分词N元模型上下文信息
- 文献传递
- 嵌入语义动作的LR分析器构造方法被引量:1
- 1998年
- 拓广LR分析方法,给出一种在LR分析表中嵌入语义动作的构造方法,对于那些可以在自底向上分析的同时完成求值的语法制导翻译描述,一般不必引入标记非终结符号即可完成对它们的分析和求值,可用于构造更为易用和有效的编译器生成工具.
- 卢伟李堂秋
- 关键词:翻译模式LR分析机器翻译