教育部人文社会科学研究重大课题攻关项目(12JZD014)
- 作品数:27 被引量:89H指数:5
- 相关作者:施建军林丽高陆洋马会霞陈荟慧更多>>
- 相关机构:北京外国语大学中国人民解放军外国语学院上海外国语大学更多>>
- 发文基金:教育部人文社会科学研究重大课题攻关项目国家社会科学基金中国博士后科学基金更多>>
- 相关领域:语言文字自动化与计算机技术文化科学政治法律更多>>
- 汉语真需要词间空格吗——对汉语分词连写献疑被引量:4
- 2014年
- 汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语"切分单位"的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。
- 熊文新
- 关键词:汉语分词语言规划
- 从Fillmore文献分析框架语义学发展态势被引量:2
- 2016年
- 框架语义研究是将语言学研究与知识工程实践有机结合的典范。其创始人Fillmore自1975年至2011年间独立或以第一作者撰写的21篇框架语义学重要文献体现出其研究的开拓性和纲领性。系统性地进行文献评述,基本可以展现框架语义研究的主脉,完整归纳出其特点与优势,准确分析其不足与发展趋势。特点与优势是该领域相关研究的重要选题依据,不足和发展趋势将成为该领域相关研究新的方向和突破口。
- 林丽
- 关键词:框架语义学
- 韩国语言净化事业——“国语醇化运动”的启示被引量:4
- 2013年
- 韩国的"国语醇化运动"对中国的语言规范化事业有较高参考价值。本文对韩国语的"国语醇化运动"的发展历程和主要内容进行了考察,评价其意义,分析其不足,结合我国实际情况,指出语言规范化是必要和可能的,要搞好语言规范化事业,首先要保证"科学性",要考虑到语言发展的"惯性"问题、处理好语言规范学理与语言实际应用状况之间的关系问题、要给语言留下可持续发展的空间。同时,政府、学界、舆论、民众的共同参与也至关重要。
- 高陆洋
- 关键词:语言政策
- 中国语“一概”と日本语‘一概'构文上の异同—肯定·否定を中心に
- <正>~~
- 石立珣
- 文献传递
- 汉日同形词意义用法的对比方法研究被引量:21
- 2013年
- 汉语和日语中存在着大量同形词,大多数同形词的意义用法在汉语和日语之间存在着微妙差别。学界对汉日同形词意义用法的对比方法尚缺乏系统探讨,绝大多数研究只涉及少数词汇的个别侧面,其方法只适用于其所考察的词汇,没能归纳出一个普遍方法。本文利用大规模语料库,通过对大量实例考察发现,汉日同形词的意义用法差别总是体现在四个层面,即意义、词性、句法功能、搭配关系。这四个层面上的差别呈阶梯型层级关系,按此进行分析,就可基本上探清每一对汉日同形词的差别所在。
- 施建军洪洁
- 汉日同形V-N动词用法对比
- 2019年
- 汉语和日语中有近350个汉日同形V-N动词,利用语料库调查其在两国语言中的用法可以发现,近三分之一的动词在汉日语中用法相同,其中多数无法带宾语,仅有少数可以带宾语。剩余近三分之二的动词在汉日语中用法存在差异,主要区别是汉语无法直接带宾语,而日语具备直接带宾语的能力。汉语受词语结构影响,一般V-N动词很少能带宾语,而日语「漢語動詞」词汇化程度高,且日语是SOV结构,对V-N动词带宾语的限制没有汉语严格,因此日语中多数V-N动词具备带宾语的能力。
- 许雪华
- 关键词:宾语
- 中日同形词意义用法距离的计量研究——以对译比构建的F-measure为尺度被引量:10
- 2016年
- 中日同形词意义用法的差异一直是日语教学的一个重点,也是汉日语对比研究中的一个热点。传统研究试图用同形同义、同形异义、同形近义三分类的方法从意义用法上区分同形词。但是,这种区分方法存在一个难以解决的问题,即同形近义词的用法差异得不到精确描述,因为同形近义词的用法差异有大有小,其意义用法距离的大小无法用"同形近义"来衡量。本文提出了以对译语料库为知识库,以同形词的对译比和在其基础上构建的F-measure为参数描写中日同形词意义用法距离的方法,并用1900余对常用的中日同形词进行验证,取得了很好的效果。
- 施建军谯燕
- 关键词:中日同形词F-MEASURE
- 日本的“国字”问题及其汉语读音规范研究——以地名中的日本“国字”为例
- 2016年
- 日本'国字'也被称作'和制汉字',如'杁'、'桝'、'袰'、'峠'等,目前常见的约有100余个。这些日本'国字'主要用于地名、人名和动植物名。由于汉语中没有对应的汉字,在认读上会给操汉语的人带来很大的不便。因此,对日本的'国字'进行必要的整理和归纳,并制定出相应的汉语读音规范具有重大现实意义。本文从语言本体规划的角度,以地名中的'国字'为例,就日本'国字'的汉语读音规范化问题提出了几点建议。
- 韩涛
- 中日同形词的名形句法差异研究
- 2018年
- 本文利用语料库考察了《现代汉语词典(第六版)》中为形容词,?新明解国語辞典(第七版)?中为名词的167个中日同形词,发现多数同形词的词性用法与词典标注存在差异,其中汉日语皆为形容词的有72个,汉日语皆为名形兼类的有31个。日语在判定词性时过于依赖形态标准,忽略了实际句法功能,导致许多具有形容词功能的同形词被认定为名词。此外,汉语为名形兼类,日语为名词的有45个。构词语素的性质差异、汉日语中词性用法的历时变化等是造成词性差异的主要原因。还有19个词在日语中无法单独使用,应视作语素,日语使用频率的降低引起了汉日语词性用法的差异。
- 许雪华
- 关键词:中日同形词语料库名词形容词
- 再论中日两国语言中的同形词问题被引量:14
- 2014年
- 本文以《光明日报》和《每日新闻》两种报纸约3亿多字的语料为对象,对中日两国实际语言生活中使用的中日同形词进行了考察,根据统计到的大量语言事实对中日同形词做出界定,认为判断中日同形词的第一要素应是词形相同。但是,中日同形词的情况非常复杂,因此本文在词形要素的前提下又提出了3条补充原则。根据这些原则,将中日同形词分成了词形相同的标准同形词和词形相似且中日之间有渊源关系的广义同形词两大类,并按此原则对中日同形词进行了大规模筛选。
- 施建军许雪华
- 关键词:中日同形词