国家教育部“211”工程(无)
- 作品数:16 被引量:190H指数:7
- 相关作者:陈小荷倪传斌金晓兵李葆嘉赵家栋更多>>
- 相关机构:南京师范大学南京军区南京总医院盐城师范学院更多>>
- 发文基金:国家教育部“211”工程国家社会科学基金国家自然科学基金更多>>
- 相关领域:语言文字自动化与计算机技术历史地理医药卫生更多>>
- 一种利用注疏的《左传》分词新方法被引量:19
- 2012年
- 先秦文献的注疏文献中包含有大量词汇语义知识,是先秦文献自动分词的重要依据。该文以篇幅最大的先秦文献《左传》为研究对象,在对《左传》及其注疏文献进行自动对齐的基础上,提出了一种利用注疏的《左传》分词新方法。分词实验的F值达到89.0%,较之baseline有明显提升。该方法无需训练语料,利用注疏文献辅助分词的思想也适合推广到其他先秦文献的自动分词任务中去。
- 徐润华陈小荷
- 关键词:先秦文献自动对齐自动分词
- 基于CRF的古汉语分词标注一体化研究
- 本文在计算机自然语言处理和古代汉语、特别是先秦文献的交叉领域进行了新的探索。首先对《左传》文本进行了词汇处理(分词和词性标注)和分析,然后采用条件随机场模型(CRF),基于两个模板进行自动分词、词性标注、分词标注一体化的...
- 石民陈小荷于丽丽李斌
- 关键词:古汉语分词词性标注左传
- 文献传递
- 敦煌诗歌语词释证
- 2012年
- 本文结合敦煌写本原卷影印资料、中土文献和佛经材料,运用训诂学、音韵学及汉语俗字研究的最新成果,从汉语词汇史的角度对敦煌诗歌中"珠骑"、"(舟歺)(舟重)"、"软互"等部分疑难语词作了尝试性的延证考释,以便学术界更好地利用敦煌诗歌进行相关研究。
- 赵家栋董志翘
- 关键词:敦煌诗歌语词
- 一种利用注疏的《左传》分词新方法
- 先秦文献的注疏文献中包含有大量词汇语义知识,是先秦文献自动分词的重要依据。本文以篇幅最大的先秦文献《左传》为研究对象,在对《左传》及其注疏文献进行自动对齐的基础上,提出了一种利用注疏的《左传》分词新方法。分词实验的F值达...
- 徐润华陈小荷
- 关键词:先秦文献自动对齐自动分词
- 文献传递
- 试论句法范畴义征标记集的建构
- 2012年
- "词汇语义—句法语义"的衔接是句法—语义接口的重要内容,也是句法结构生成的关键。句法范畴义征是词汇语义与句法语义的衔接桥梁,其提取和标记集的建构是衔接研究的基础。本研究基于语义范畴的义征分析和语义子场的概括抽象,共提取句法范畴义征61个,经过对《受限词元表》中50个常用词(包括名、动、形三类)所形成的组合结构以及汉语简单句型(220个)的验证增补,建构了优化的《句法范畴义征标记集》(76个),并对所提取的范畴义征进行了界定。作为工程语言学项目,句法范畴义征标记集的建构,最终是为句法结构的理解生成服务的。
- 孙道功
- 关键词:语义范畴
- 古籍版本异文的自动发现被引量:10
- 2010年
- 该文提出了古籍版本异文自动发现方法:首先由bigram计算得到句珠相似度,根据相似度发现最有可能的句珠配对,然后在异文句珠中不断地去掉最长"同文"并输出异文。研究个案是三传春秋经,结果表明,句珠配对全部正确,异文配对算法也能够正确发现全部符合定义的异文。
- 肖磊陈小荷
- 关键词:古籍相似度
- 二语语音的识别方式与激活脑区被引量:7
- 2010年
- 采用行为测量和功能性核磁共振成像技术,以明确二语语音的激活脑区定位与识别方式。本文对比分析了23名高水平晚双语者在进行高频、强规则性和强词汇性二语真词的同韵判断时,与假词和对照字符在行为学和影像学上所表现出来的差异。行为学和影像学结果显示:高水平晚双语者在识别真词和假词的语音时,速度相近,均明显慢于对照字符的识别;所激活的脑区集中在左背侧外额叶系统功能区、左腹侧前额叶系统功能区、左背侧顶下系统功能区和双腹侧颞-枕系统功能区;这些脑区与其母语语音处理的脑区相似,并在整体上表现出较强的左侧化,在枕叶和小脑等局部表现出较弱的右侧化。上述结果表明:高水平晚双语者在识别二语语音时,激活的脑区仍然是母语语音处理的脑区,采用的可能是合成方式而不是直呼方式。
- 倪传斌卢光明张志强王中秋徐晓东张智义
- 关键词:FMRI二语习得语音
- 企业职务命名的社会语言学分析
- 2011年
- 随着我国市场经济的深入发展,我国企业职务命名发生了许多新的变化。本文通过招聘网站调查、相关资料分析和企业实地考察,分析企业职务名称在命名要素的表现形式、命名要素的构成搭配方面呈现出的变化和特点,并探寻这些变化所反映的社会文化心理。
- 殷志平
- 关键词:职务品位职位
- 先秦人名识别初探被引量:7
- 2009年
- 先秦人名和现代人名的构成方式和上下文语境有很大不同。本文以先秦文献《春秋左传》为突破口,对书中的人名进行了统计分析.挖掘其内部特征及分布特征,并且利用CRF模型对先秦人名的识别进行了初步的尝试。在开放测试中,该方法取得了92.48%的准确率。
- 汪青青
- 关键词:CRF模型
- 慧琳《圣教序》、《述三藏记》音义版本及文献价值
- 2011年
- 慧琳《圣教序》及《述三藏记》音义所据的佛经本子附有太宗、高宗对玄奘法师表谢的手敕报书文字,这与藏经的记录有所不同。今见《大唐三藏圣教序碑》与《圣教序》及《述三藏记》亦存在一定文本差异。慧琳音义所据藏经具有较高的版本文献价值。
- 赵家栋
- 关键词:《圣教序》慧琳《一切经音义》