教育部人文社会科学研究基金(09YJC870014)
- 作品数:8 被引量:58H指数:3
- 相关作者:薛春香徐硕朱礼军乔晓东张运良更多>>
- 相关机构:南京理工大学中国科学技术信息研究所南京农业大学更多>>
- 发文基金:教育部人文社会科学研究基金江苏省社会科学基金中国科学技术信息研究所预研基金项目更多>>
- 相关领域:文化科学自动化与计算机技术语言文字更多>>
- 外语类院校核心竞争力评价模型构建——以高校T为例被引量:3
- 2012年
- 文章通过参考、研究和创新,建立了外语类院校核心竞争力评价指标,运用层次分析法计算得出各层次评价指标的权重,利用灰色关联度法建立了外语类院校核心竞争力通用评价模型。并以高校T作为实例,分析得到其核心竞争力所在。
- 范佳佳高洁
- 关键词:外语类院校核心竞争力层次分析法
- 中文报纸文献标引知识库设计与构建被引量:1
- 2013年
- 报纸文献主题标引、分类标引和命名实体抽取是其内容深加工的主要形式,基于知识库的自动标引是报纸文献标引自动化的一种实现方式。在报纸文献自动标引研究现状基础上提炼出报纸文献自动标引一般流程,提出知识库建设是其实现自动标引的前提。结合报纸文献标引的特点,提出报纸文献标引用知识库应由主题标引库、分类知识库和实体标引库三部分多个词表组成,具有多词表融合、规模大、可扩充、简单易行等特点。同时,就知识库构建中的主题规范表、分类主题对照表和命名实体抽取规则库建设等关键技术进行阐述。
- 薛春香
- 关键词:报纸文献自动标引分类标引知识库
- 共现聚类分析的新方法:最大频繁项集挖掘被引量:22
- 2012年
- 针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性。为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法——最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷。通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果。
- 徐硕乔晓东朱礼军张运良薛春香
- 关键词:共现分析共词分析聚类分析最大频繁项集
- 广义后缀树及其在汉语科技词系统中的应用研究被引量:2
- 2013年
- 科技词汇知识是科技信息智能处理的基石,如何加速汉语科技词系统的构建是目前研究的热点问题之·。考虑到中文术语构词的特点,文章引入了一种灵活的数据结构——广义后缀树,从字面的角度提出了关系辅助构建、任务分配以及输入提示等辅助工具,使得知识工程师的工作更加高效。
- 徐硕乔晓东朱礼军张运良薛春香
- 关键词:广义后缀树汉语科技词系统
- 面向新闻领域的中文文本分类研究综述被引量:24
- 2013年
- 在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
- 薛春香张玉芳
- 关键词:新闻分类文本分类中文信息处理
- 中文报纸文献内容深加工研究初探
- 2012年
- 报纸文献是一种未被充分开发的重要信息源。我国报纸文献数据库建设已经实现从题录库向全文库的发展,为报纸文献内容加工和挖掘提供了保障。但目前报纸文献缺乏统一完善的加工规范和标准,内容加工的方式也以简单的分类索引和人工剪报为主,加工自动化水平和加工深度不够,应向深层次、自动化、产品化方向发展。
- 薛春香
- 关键词:报纸文献文献数据库
- 叙词表词汇控制机制变革的探讨被引量:6
- 2013年
- 新的信息环境引发了检索机制的变革,为适应网络环境中标引和检索的需要,叙词表词汇控制机制发生了相应变化。文章从词类控制、词量控制、词形控制、词义控制、词间关系控制、先组度控制等方面对网络环境下叙词表编制中的词汇控制的变化进行探讨。文章认为网络环境下叙词表词汇控制机制应向受控语言自然语言化方向发展,表现出选词和规范化控制的弱化、结构化控制的强化、控制技术的智能化以及词汇控制与互操作相结合等特点。
- 薛春香侯汉清
- 关键词:叙词表编制词汇控制受控语言知识组织系统互操作
- 中文报纸文献内容深加工研究初探
- 2011年
- 报纸文献是一种未被充分开发的重要信息源。我国报纸文献数据库建设已经实现从题录库向全文库的发展,为报纸文献内容加工和挖掘提供了保障。但目前报纸文献缺乏统一完善的加工规范和标准,内容加工的方式也以简单的分类索引和人工剪报为主,加工自动化水平和加工深度不够,应向深层次、自动化、产品化方向发展。
- 薛春香
- 关键词:报纸文献文献数据库