冀铁亮
- 作品数:9 被引量:14H指数:3
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 语言学与统计方法结合建立汉语动词SCF类型集被引量:3
- 2007年
- 动词子语类框架(Subcategorization Frame以下简称SCF)在句法分析、语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建立了获得普遍共识的子语类框架类型集。而汉语方面还没有标准的动词子类框架类型集。本文提出一种语言学知识与统计方法相结合的汉语动词子语类框架类型集的半自动获取方案。初步建立起既符合统计结果又基本符合语言学理论的汉语动词子语类框架类型集。实验证明,加入语言学理论的子语类框架类型集降低了对语料的依赖程度,比完全由分析语料产生的类型集更完备。
- 冀铁亮孙薇薇穗志方
- 关键词:计算机应用中文信息处理
- 汉语动词子语类框架提取技术研究与实现
- 动词子语类框架(subcategorization frame,以下简称SCF)信息在语言学上有重要的意义,它可以解决绝大部分词语的论元和附属语区分问题。在概率句法分析应用中,子语类框架信息可以大大提高句法分析的准确率,...
- 冀铁亮
- 关键词:汉语动词信息提取
- 语言学与统计方法结合建立汉语动词子类框架类型集
- 动词子语类框架(subcategorization frame 以下简称 SCF)在语义角色标注等方面的研究中具有不可或缺的重要作用。在于语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建...
- 冀铁亮孙薇薇穗志方
- 文献传递
- 词汇化概率句法分析与动词子语类框架获取的互动方法
- 概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器.规则集主要是针对词类和短语类.然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同.目前NLP研究的一个趋势和热点就是词汇化的...
- 冀铁亮穗志方
- 关键词:词汇知识句法分析
- 文献传递
- 领域Ontology自动构建研究
- 利用自然语言处理(NLP)理论和技术方法对已有公认领域知识,如专业叙词表、专业辞典、专业教材或权威著作等进行重构利用;借助领域专家知识,实现了基于网络的知识采集与加工;建立起受限文本的Ontology自学习机制,从而实现...
- 刘耀穗志方胡永伟冀铁亮
- 关键词:领域本体自然语言处理叙词表知识工程
- 文献传递
- 词汇化句法分析与子语类框架获取的互动方法被引量:5
- 2007年
- 概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器。规则集主要是针对词类和短语类。然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同。目前NLP研究的一个趋势和热点就是词汇化的句法分析。针对概率句法分析独立性假设中缺乏词汇化的缺陷,本文将谓语动词的子语类信息与概率句法分析结合起来,提出一种基于动词子语类信息的词汇化概率句法分析方法。论文建立了基于汉语动词子语类框架的统计句法分析模型,并且针对动词子语类框架难以获取的问题,提出一种词汇化概率句法分析与动词子语类框架获取的互动方法。实验利用这种互动的方法获取了汉语中十个常用高频动词的概率化子语类信息,并结合原有的概率句法分析器PCFG实现了一个基于动词子语类信息的概率句法分析器原型系统S-PCFG。实验证明了基于动词子语类信息的概率句法分析对自然语言句法分析的准确率和速度均有所提高。同时分析了新的概率句法分析器的不足之处,为进一步的改进提供条件。
- 冀铁亮穗志方
- 关键词:计算机应用中文信息处理
- 领域Ontology自动构建研究被引量:5
- 2006年
- 利用自然语言处理(NLP)理论和技术方法对已有公认领域知识,如专业叙词表、专业辞典、专业教材或权威著作等进行重构利用;借助领域专家知识,实现了基于网络的知识采集与加工;建立起受限文本的Ontology自学习机制,从而实现领域Ontology概念描述体系的自动构建.最终有效地解决了Ontology的自动构建这一瓶颈问题,成功地探索出了一种较为理想、实用的理论与方法,为专业领域Ontology的自动构建提供了理论依据及技术支持.
- 刘耀穗志方胡永伟冀铁亮
- 关键词:领域本体自然语言处理叙词表知识工程
- 领域Ontology自动构建研究
- 利用自然语言处理(NLP)理论和技术方法对已有公认领域知识,如专业叙词表、专业辞典、专业教材或权威著作等进行重构利用;借助领域专家知识,实现了基于网络的知识采集与加工;建立起受限文本的Ontology自学习机制,从而实现...
- 刘耀穗志方胡永伟冀铁亮
- 关键词:领域本体自然语言处理叙词表知识工程
- 文献传递
- 词汇化概率句法分析与动词子语类框架获取的互动方法
- 概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器。规则集主要是针对词类和短语类。然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同。目前NLP研究的一个趋势和热点就是词汇化的...
- 冀铁亮穗志方
- 文献传递