您的位置: 专家智库 > >

中国传媒大学国家语言资源监测与研究有声媒体中心

作品数:20 被引量:131H指数:8
相关作者:侯明午陈毓麒朱波李雪燕张叶青更多>>
相关机构:上海大学文学院新疆大学信息科学与工程学院更多>>
发文基金:中央高校基本科研业务费专项资金国家社会科学基金新疆维吾尔自治区自然科学基金更多>>
相关领域:语言文字自动化与计算机技术文化科学更多>>

文献类型

  • 19篇中文期刊文章

领域

  • 10篇语言文字
  • 8篇自动化与计算...
  • 1篇文化科学

主题

  • 5篇抽取
  • 4篇对象抽取
  • 4篇评价对象抽取
  • 4篇词典
  • 3篇短语
  • 3篇语义
  • 3篇中文
  • 2篇对齐
  • 2篇形容词
  • 2篇语料
  • 2篇平行语料
  • 2篇情绪
  • 2篇字母词
  • 2篇名词
  • 2篇名词短语
  • 2篇汉语
  • 1篇定语
  • 1篇对齐方法
  • 1篇多语种
  • 1篇信息处理

机构

  • 19篇中国传媒大学
  • 2篇上海大学
  • 2篇许昌学院
  • 1篇北京语言大学
  • 1篇新疆大学

作者

  • 12篇侯敏
  • 7篇滕永林
  • 4篇周红照
  • 3篇侯明午
  • 2篇钱小飞
  • 2篇朱波
  • 2篇张晶
  • 2篇陈毓麒
  • 1篇郑双美
  • 1篇张叶青
  • 1篇颜彭莉
  • 1篇李甜
  • 1篇梁琳琳
  • 1篇李雪燕

传媒

  • 4篇语言文字应用
  • 2篇北京大学学报...
  • 2篇语言战略研究
  • 2篇中文信息学报
  • 1篇计算机工程
  • 1篇现代图书情报...
  • 1篇唐山师范学院...
  • 1篇语言科学
  • 1篇数字技术与应...
  • 1篇重庆邮电大学...
  • 1篇语言研究集刊
  • 1篇现代语文
  • 1篇语料库语言学

年份

  • 1篇2023
  • 4篇2020
  • 1篇2019
  • 3篇2017
  • 2篇2016
  • 2篇2015
  • 4篇2014
  • 2篇2013
20 条 记 录,以下是 1-10
排序方式:
评价形容词定语语义指向研究及其自动识别机制被引量:4
2020年
评价形容词在句子中做定语时,语义指向有多种可能性,计算机自动识别的难度较大。首先,基于500条样本语料的考察分析,把评价形容词定语的语义指向对象划分为定语中心语(36%)、主语(41%)、其他句子成分(23%)三种基本类型;然后,基于词义特征、句法模式、语义框架等,把三种基本类型拆解为十二种下位类型;接着,用机器可读的形式语言表示十二种下位类型,建立"评价形容词定语语义指向识别与抽取"规则簇;再次,选取1000条测试语料开展对比实验,评价对象抽取的准确率、召回率、F值均提升20%左右,三项评价指标均达到85%以上;最后,对系统匹配错误和未匹配的句子进行分析,提出做好中文评价对象抽取任务需要加强语言本体的深入研究。
周红照侯敏滕永林
关键词:形容词定语语义指向评价对象抽取
汉语最长名词短语的结构复杂性研究被引量:1
2017年
文章从结构的视角界定了汉语最长名词短语(MNP)的复杂性概念,提出以内部结构的分布倾向性和结构标记性两个指标作为判断复杂结构的依据,将最长名词短语分为简单MNP和复杂MNP。复杂MNP包括了有标记和无标记两种情况,其中有标记的复杂MNP形式多样,占据了主要部分。从分布位置上看,复杂MNP的'的'前定语位置对复杂结构的容纳性最强,但中心语位置也包含少量复杂结构。复杂结构外化为线性表面,形成了动词介词成分内含、边界处连续动词介词分布、歧义结构等识别中的难点问题,针对性地研究这些问题有助于最长名词短语的识别工作。
钱小飞侯敏
评价短语的倾向性分析研究被引量:8
2013年
评价短语是评价因子之一,是汉语倾向性研究的重要组成部分。评价短语可以分为"评价词+评价词"、"修饰词+评价词"、"普通词+评价词"、"修饰词+普通词"、"普通词+普通词"5类。评价短语类型不同,采用的倾向性分析策略也不同。短语计算规则和短语评价词典的互动是该文采用的基本方法。在制定短语计算规则时应遵守共性与个性相结合的原则;建立短语评价词典时应遵循最小评价因子原则。实验证明,短语计算规则与短语词典的建立提高了倾向性分析系统的准确率,是一种行之有效的方法。
侯敏滕永林陈毓麒
字母词使用六十年被引量:13
2016年
本文在1955—2015年的《人民日报》中选择13个年度的语料作为样本,调查了近60年来字母词的使用状况。调查结果显示,在这60年中,字母词在汉语表达中已占有一定空间,经历了数量大幅增长又逐渐趋于平稳的阶段,字母词原型由"字母+汉字"形式转向英文缩略词;字母词使用中独用词多,低频词多,稳定性差,较多的失范现象影响了信息传播和语言交际。在归纳字母词使用规律的基础上提出了思考与建议,希望能为政府制定相关政策提供参考。
侯敏滕永林
关键词:字母词语言调查语言监测
字母词形式特征分析
2015年
字母词与传统汉语词汇在形式上有很大的区别,在词长和内部组合上独具特点。统计发现,字母词平均词长为3.92字符,长于汉语词汇的平均词长,长度为3的字母词数量最多;每个字母词中平均有3.15个字母,其中含3个字母的字母词数量最多;每个含有汉字的字母词中平均有2.25个汉字,其中含2个汉字的字母词数量最多。随着字母词中字母个数的增加,带汉字的情况会减少。
李甜侯敏
关键词:字母词字母汉字
面向信息处理的汉语最长名词短语界定研究被引量:3
2017年
目前广泛采纳的最长名词短语定义是以其句法功能划分出的短语子集,导致了近30%的边界识别错误,同时由于对基本特征缺乏一致认识,不同研究的定义结果也有所不同。本文讨论了最长名词短语的长度约束、名词性认定、外延范围和层次构造等问题,提出按照句法位置特征划分出最长名词短语全集,定义为句子中不被其他名词短语直接包含的名词短语,其中包括单词结构、名词性短语和离心式名词短语。新定义的最长名词短语具有功能上的一致性和分布的相似性,减少了边界歧义,它呈现多层分布,但集中的层级分布倾向也预示了高效识别的可能性。
钱小飞侯敏
关键词:中文信息处理句法位置全集
在语言生活中如何正确把握普通话与方言的关系——上海版教材“外婆改姥姥”事件引发的思考被引量:1
2019年
正确认识方言和普通话的关系是语言规划的重要工作。针对不久前网络上较热的上海版教材"外婆改姥姥"引发的争议,本文对外祖母称谓的历时演变和地理分布进行了考察和研究,并详细调查了"外婆""姥姥"在媒体语言和社会生活中的实际使用情况。随着语言的发展和演变,语言规划工作应以实际语言生活为依据,把握好标准化与统一化工作的"度";此外,字典辞书也应随着语言政策及语言生活的变化予以及时修正,与时俱进,统一标准,切实起到工具书的作用。
张茹淇邹煜
关键词:外婆姥姥语言规划
基于锚点句对的汉维句子对齐方法被引量:5
2015年
为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚点句对),并将其作为分割标志对全文进行分段,在各片段内使用基于长度的方法实现全部句子的对齐,采用词汇、数字、标点符号和长度信息提高方法的领域移植性,使用分段方法避免复杂的计算过程,从而解决错误蔓延问题。实验结果表明,该方法的准确率达到95.2%,比基于长度的句子对齐方法提高了2.7%。
塞麦提.麦麦提敏侯敏吐尔根.伊布拉音
关键词:平行语料库句子对齐锚点
基于语义分类的比较句识别与比较要素抽取研究被引量:9
2014年
比较是人们常用的评估不同事物优劣、异同的表达方式,利用机器识别比较句并进一步抽取比较要素是语言信息处理领域一项新颖又有实用价值的课题。该文依据比较句与比较要素之间是一种"你中有我,我中有你"的共生关系,将比较句识别与比较要素抽取两个任务合二为一完成;根据词意分类,构建由领域词典、情感词典、标记词典、普通词典构成的词典系统;根据汉语比较句句义分类,构建比较句识别与比较要素抽取规则库。以第四届中文倾向性评测(COAE2012)发布的测试语料为实验对象,该系统取得了较好的实验(评测)结果。
周红照侯明午侯敏滕永林
关键词:语义分类
评价知识本体研究与规则实现被引量:7
2016年
【目的】建立一套集评价句识别、倾向性判定、评价对象抽取于一体的评价分析智能系统。【方法】对中文评价知识本体进行研究,基于本体研究成果建立评价分析规则库,实现基于词典规则的评价分析智能系统CUCsas。【结果】以第7届中文倾向性分析评测(COAE2015)发布的50 000篇微博(共计133 201个句子)为实验数据,系统评价句识别及倾向性判定的正确率、召回率和F值分别为0.83、0.70、0.76,而评价对象抽取的结果较差。【局限】系统尚缺少评价新词发现和领域词典自动构建模块。【结论】初步建立起一套实用化的评价分析智能系统。
周红照侯敏滕永林
关键词:评价对象抽取
共2页<12>
聚类工具0