您的位置: 专家智库 > >

国家自然科学基金(70901054)

作品数:3 被引量:26H指数:3
相关作者:冯楠常鹏马辉解晶更多>>
相关机构:天津大学天津城市建设学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术社会学经济管理更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...
  • 1篇经济管理
  • 1篇社会学

主题

  • 2篇文档
  • 2篇文档相似度
  • 2篇相似度
  • 2篇词共现
  • 1篇信息系统
  • 1篇证据理论
  • 1篇网络
  • 1篇网络信息
  • 1篇网络信息系统
  • 1篇文本挖掘
  • 1篇文档聚类
  • 1篇文档聚类算法
  • 1篇文档模型
  • 1篇聚类
  • 1篇聚类算法
  • 1篇不确定环境
  • 1篇不确定性
  • 1篇NIS

机构

  • 3篇天津大学
  • 1篇天津城市建设...

作者

  • 3篇冯楠
  • 2篇常鹏
  • 1篇解晶
  • 1篇马辉

传媒

  • 1篇计算机工程
  • 1篇中文信息学报
  • 1篇管理学报

年份

  • 2篇2012
  • 1篇2011
3 条 记 录,以下是 1-3
排序方式:
基于词共现的文档表示模型被引量:8
2012年
文档表示模型是文本自动处理的基础,是将非结构化的文本数据转化为结构化数据的有效手段。然而,目前通用的空间向量模型(Vector Space Model,VSM)是以单个的词汇为基础的文档表示模型,因其忽略了词间的关联关系,导致文本挖掘的准确率难以得到很大的提升。该文以词共现分析为基础,讨论了文档主题与词的二阶关系之间的潜在联系,进而定义了词共现度及与文档主题相关度的量化计算方法,利用关联规则算法抽取出文档集上的词共现组合,提出了基于词共现组合的文档向量主题表示模型(Co-occurrence Term based Vector SpaceModel,CTVSM),定义了基于CTVSM的文档相似度。实验表明,CTVSM能够准确反映文档之间的相关关系,比经典的文档向量空间模型(Vector Space Model,VSM)具有更强的主题区分能力。
常鹏冯楠
关键词:词共现文档相似度文本挖掘
一种基于词共现的文档聚类算法被引量:16
2012年
为解决文本主题表达存在的信息缺失问题,提出一种基于词共现的文档聚类算法。利用文档集上的频繁共现词建立文档主题向量表示模型,将其应用于层次聚类算法中,并通过聚类熵寻找最优的层次划分,从而准确反映文档之间的主题相关关系。实验结果表明,该算法所获得的结果优于其他基于短语的文档层次聚类算法。
常鹏冯楠马辉
关键词:文档聚类文档模型词共现文档相似度
多重不确定环境下基于证据理论的NIS安全风险评估模型被引量:3
2011年
以证据理论为基础,构造一种能够适应多重不确定环境的网络信息系统安全风险评估模型。在模型中建立安全风险评估指标体系并对指标权重进行量化;重新定义基本概率赋值函数,以适应安全风险评估过程中证据的不确定性描述;实现证据一致性检验并确定调整方法,从而进一步降低评估过程中专家经验的不确定性;最后,通过实证分析验证该模型的正确性和有效性。
冯楠解晶
关键词:网络信息系统不确定性证据理论
共1页<1>
聚类工具0