您的位置: 专家智库 > >

国家自然科学基金(70903032)

作品数:8 被引量:49H指数:4
相关作者:章成志李蕾黄红霞康小丽汤丽娟更多>>
相关机构:南京理工大学中国科学技术信息研究所南昌大学更多>>
发文基金:国家自然科学基金教育部人文社会科学研究基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术文化科学经济管理更多>>

文献类型

  • 8篇期刊文章
  • 1篇会议论文

领域

  • 6篇自动化与计算...
  • 2篇文化科学
  • 1篇经济管理

主题

  • 3篇社会化标签
  • 3篇标签
  • 2篇多语
  • 2篇语料
  • 2篇语料库
  • 2篇聚类
  • 1篇多语言
  • 1篇信息检索
  • 1篇一体化
  • 1篇用户生成内容
  • 1篇语料库构建
  • 1篇语义分析
  • 1篇社会关系
  • 1篇社会关系网
  • 1篇社会关系网络
  • 1篇术语抽取
  • 1篇双语
  • 1篇随机场
  • 1篇条件随机场
  • 1篇平行语料

机构

  • 8篇南京理工大学
  • 1篇南昌大学
  • 1篇中国科学技术...
  • 1篇香港城市大学
  • 1篇百度在线网络...

作者

  • 8篇章成志
  • 1篇康小丽
  • 1篇李蕾
  • 1篇汤丽娟
  • 1篇黄红霞
  • 1篇刘飒
  • 1篇揭春雨

传媒

  • 4篇现代图书情报...
  • 1篇情报学报
  • 1篇情报理论与实...
  • 1篇中文信息学报
  • 1篇Chines...
  • 1篇国家自然科学...

年份

  • 1篇2018
  • 2篇2013
  • 2篇2012
  • 2篇2011
  • 2篇2010
8 条 记 录,以下是 1-9
排序方式:
基于多语言社会化标签聚类的潜在社会关系网络发现被引量:4
2013年
文章采用分裂式层次聚类算法分别对中英文标签进行聚类,在标签聚类的基础上,采用先聚类后翻译的映射策略实现中英文标签的映射;在标签聚类及映射的基础上,自动发现多语言环境下潜在的社会关系网络。实验结果表明多语言环境下的社会关系网络比单一语言环境下的社会关系网络更为丰富。
章成志汤丽娟
关键词:社会化标签
社会化标签质量评估研究综述被引量:10
2013年
旨在对有关社会化标签质量相关研究进行总结,首先阐述社会化标签质量评估问题的产生背景,然后对现有社会化标签质量评估方法进行总结与比较分析,指出社会化标签质量评估中存在的问题,对社会化标签质量评估研究和未来发展方向提出展望。
李蕾章成志
关键词:社会化标签用户生成内容WEB2
Generating a multilingual taxonomy based on multilingual terminology clustering
2011年
Taxonomy denotes the hierarchical structure of a knowledge organization system. It has important applications in knowledge navigation, semantic annotation and semantic search. It is a useful instrument to study the multilingual taxonomy generated automatically under the dynamic information environment in which massive amounts of information are processed and found. Multilingual taxonomy is the core component of the multilingual thesaurus or ontology. This paper presents two methods of bilingual generated taxonomy: Cross-language terminology clustering and mixed-language based terminology clustering. According to our experimental results of terminology clustering related to four specific subject domains, we found that if the parallel corpus is used to cluster multilingual terminologies, the method of using mixed-language based terminology clustering outperforms that of using the cross-language terminology clustering.
Chengzhi ZHANG
基于双语URL匹配模式可信度的平行网页识别研究被引量:3
2018年
平行语料是自然语言处理中一项重要的基础资源,在双语平行网页中大量存在。该文首先介绍双语URL匹配模式的可信度计算方法,然后提出基于局部可信度的双语平行网页识别算法,再依据匹配模式的全局可信度,提出两种优化方法:即利用全局可信度,救回因低于局部可信度阈值而被初始算法滤掉的匹配模式;通过全局可信度和网页检测方法,挖出深层网页。进一步,结合网站双语可信度、链接关系,侦测出种子网站周边更多较具可信度的双语网站。除了双语URL匹配模式自动识别,还利用搜索引擎,依据少数高可信度的匹配模式快速识别双语网页。为了提高以上五种方法识别候选双语网页对的准确率,计算了候选双语网页对的双语相似度,并设置阈值过滤非双语网页对。通过实验验证了所提方法的有效性。
章成志马舒天揭春雨揭春雨
关键词:平行语料库
中文微博用户标签的调查分析——以新浪微博为例被引量:6
2012年
以新浪微博为例,采集微博用户的用户标签和微博内容数据,利用这些数据进行用户特征、用户标签的语义关系、用户标签与微博内容的关联度、情感标签分布等不同方面的调查统计分析。在以上调研基础上,针对标签推荐服务提出改进建议。
黄红霞章成志
关键词:社会化标签标签推荐
用于双语术语抽取的专业领域中英文可比语料库构建被引量:5
2012年
面向双语术语抽取这一应用目标,提出专业领域可比语料库的构建方案并进行实验论证。针对给定的主题领域分别进行中英文专业语料的采集,从中分别获取中英文关键词,根据词语共现统计获取该主题领域的其他相关关键词;以这些关键词作为查询入口,通过学术搜索引擎从网络获取候选可比语料;对可比语料进行定量评估,以剔除不符合要求的语料,最终得到特定主题领域的可比语料库。
康小丽章成志
关键词:可比语料库语料库构建
基于多语文本聚类的主题层次体系生成研究1)
本文首先对基于多语言文本聚类的主题式层次体系生成相关研究进行概述,包括多语言文本聚类与跨语言文本相似度计算的研究综述;然后以近邻传播聚类算法为基础,对特征重构后的文本进行聚类得到主题式层次体系,依据机器翻译系统或者平行语...
章成志
文献传递
基于多层术语度的一体化术语抽取研究被引量:19
2011年
以往的术语抽取研究大多将语言学方法和统计方法分别进行单独的处理,并且只考虑候选术语本身的术语度,而没有考虑候选术语所在句子的术语度对术语抽取性能的影响。本文将语言学方法与统计方法进行并行融合,综合考虑候选术语及其所在语句的术语度,进行基于多层术语度的一体化术语抽取。该研究有两个特色:首先,采用条件随机场模型,能有效融合语言学方法和统计方法,实验结果表明了基于一体化策略的术语抽取方法的有效性;其次,通过语料库比较方法,提出基于多层术语度的术语抽取方法,该方法能抽取多字术语,实验结果表明了利用多层术语度进行术语抽取的有效性。
章成志
关键词:术语抽取条件随机场
多语言文本表示研究综述被引量:3
2010年
对多语言信息处理中的文本表示问题进行阐述。在分析单语言文本表示的模型和过程的基础上,说明多语言文本表示的过程,详细分类并阐述其中的各种方法,对其进行比较分析。概括多语言文本表示的特点,指出尚存在的问题,并对多语言文本表示的发展趋势进行探讨。
刘飒章成志
关键词:跨语言信息检索潜在语义分析
共1页<1>
聚类工具0