王鑫
- 作品数:4 被引量:16H指数:2
- 供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
- 发文基金:国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于浅层句法分析的中文语义角色标注研究被引量:11
- 2011年
- 语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想。因此该文将中文语义角色标注建立在了浅层句法分析的基础上。在句法分析阶段,利用构词法获得词语的"伪中心语素"特征,有效缓解了词语级别的数据稀疏问题,从而提高了句法分析的性能,F值达到了0.93。在角色标注阶段,利用构词法获得了目标动词的语素特征,细粒度地描述了动词本身的结构,从而为角色标注提供了更多的信息。此外,该文还提出了句子的"粗框架"特征,有效模拟了基于完全句法分析的角色标注中的子类框架信息。该文所实现的角色标注系统的F值达到了0.74,比前人的工作(0.71)有较为显著的提升,从而证明了该文的方法是有效的。
- 王鑫孙薇薇穗志方
- 关键词:语义角色标注浅层句法分析语素构词法
- 基于依存树距离识别论元的语义角色标注系统被引量:5
- 2012年
- 在基于依存的语义角色标注研究中,大多数系统采用机器学习方法进行论元识别和分类。该文分析了依存树的特点,发现论元集中分布于依存树上的特定局部范围内,因此提出一种基于依存树距离的论元识别方法。该方法将候选论元限制在与目标动词的依存树距离不超过3的范围内,通过制订规则,提取目标动词的最佳候选论元集合。在CoNLL2009中文语料上采用正确的依存树,识别出了98.5%的论元。在此基础上,结合基于机器学习的角色分类,系统F值达到89.46%,比前人的方法 (81.68%)有了较为显著的提升。
- 王鑫穗志方
- 关键词:语义角色标注
- 基于依存树距离的语义角色识别方法
- 在基于依存的语义角色标注研究中,大多数系统采用机器学习方法进行论元识别和分类。本文分析了依存树的特点,发现论元集中分布于依存树上的特定局部范围内,因此提出一种基于依存树距离的论元识别方法。该方法将候选论元限制在与目标动词...
- 王鑫穗志方李芸
- 关键词:语义角色标注
- 文献传递
- 基于浅层句法分析的中文语义角色标注研究
- 语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注部是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动的完全句法分析的中文语义角色标注效果并不理想.因此本文将中文语义角色标注...
- 王鑫孙薇薇穗志方
- 关键词:语义角色标注浅层句法分析语素构词法
- 文献传递