孙薇薇
- 作品数:8 被引量:5H指数:2
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- “把”字句的自动释义与句式变换研究
- 2015年
- 针对"把"字句在机器翻译中的困难,探索一种规则和统计相结合的"把"字句的自动释义和句式变换的方法。具体的计算步骤为:(1)根据"把"字句与其他句式的变换关系,将"把"字句分为不同的小类,并总结出每一小类的句法语义特征,得到"把"字句的语言模型;(2)选取北大中文树库中的"把"字句作为语料,并标注上每一小类句式的句法语义特征,从而得到富含句法语义信息的标注文本;(3)在此基础上,分别用组块分析的方法和完全句法分析的方法来对"把"字句进行自动识别;(4)再利用判别式机器学习的方法来对"把"字句进行自动分类。在识别结果和分类结果的基础上,根据释义模板和变换模板得到了一个"把"字句的自动释义与句式变换程序。
- 王璐璐孙薇薇袁毓林
- 语言学与统计方法结合建立汉语动词SCF类型集被引量:3
- 2007年
- 动词子语类框架(Subcategorization Frame以下简称SCF)在句法分析、语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建立了获得普遍共识的子语类框架类型集。而汉语方面还没有标准的动词子类框架类型集。本文提出一种语言学知识与统计方法相结合的汉语动词子语类框架类型集的半自动获取方案。初步建立起既符合统计结果又基本符合语言学理论的汉语动词子语类框架类型集。实验证明,加入语言学理论的子语类框架类型集降低了对语料的依赖程度,比完全由分析语料产生的类型集更完备。
- 冀铁亮孙薇薇穗志方
- 关键词:计算机应用中文信息处理
- 基于语料统计的现代汉语量名搭配研究
- 本文对现代汉语量词与名词的搭配进行了定量研究,设计并实现了一个有效的数量名短语的识别方法,基于识别结果,统计了部分名词受量词修饰的情况。该统计结果不但可以为名词的概率语法属性研究提供数据,而且在对外汉语教学中也有借鉴意义...
- 王萌俞士汶段慧明孙薇薇
- 关键词:现代汉语汉字处理词汇搭配语料统计
- 文献传递
- 多句法理论下的语义角色标注方法与实现
- 对语义的获取是自然语言处理领域的一个重要议题,作为一种重要的语义分析技术,语义角色标注的目标在于分析给定句子的论旨结构,亦即识别出和特定动词搭配的论元并对其进行语义分类。语义角色标注在自然语言处理的很多领域——如问答系统...
- 孙薇薇
- 关键词:语义角色标注浅层句法分析自然语言处理
- 语言学与统计方法结合建立汉语动词子类框架类型集
- 动词子语类框架(subcategorization frame 以下简称 SCF)在语义角色标注等方面的研究中具有不可或缺的重要作用。在于语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建...
- 冀铁亮孙薇薇穗志方
- 文献传递
- 基于语料统计的现代汉语量名搭配研究
- 本文对现代汉语量词与名词的搭配进行了定量研究,设计并实现了一个有效的数量名短语的识别方法,基于识别结果,统计了部分名词受量词修饰的情况。该统计结果不但可以为名词的概率语法属性研究提供数据,而且在对外汉语教学中也有借鉴意义...
- 王萌俞士汶段慧明孙薇薇
- 关键词:现代汉语量词搭配
- 文献传递
- 现代汉语名词语法属性的计量研究初探被引量:2
- 2008年
- 以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。
- 王萌俞士汶段慧明孙薇薇
- 关键词:计算机应用中文信息处理现代汉语
- 基于浅层句法分析的中文语义角色标注研究
- 语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注部是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动的完全句法分析的中文语义角色标注效果并不理想.因此本文将中文语义角色标注...
- 王鑫孙薇薇穗志方
- 关键词:语义角色标注浅层句法分析语素构词法
- 文献传递