中国科学院西部之光基金(无)
- 作品数:3 被引量:85H指数:3
- 相关作者:马建霞范云满王鹏龙任珩更多>>
- 相关机构:中国科学院文献情报中心中国科学院中国医学科学院北京协和医学院更多>>
- 发文基金:中国科学院西部之光基金国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术社会学更多>>
- 基于主成分分析的西北五省区专利资源布局评价被引量:3
- 2014年
- 在构建区域专利资源评价指标体系,并对西北五省区的专利资源布局分析的基础上,通过主成分分析方法对各省区的专利综合实力进行评价,结果表明,从专利资源基本情况看,近10年,陕西专利申请量最大,各省区的创新主体有差异。各省区专利资源技术领域在IPC小类上,重点专利资源布局具有相似性;从专利数量、质量、价值和区域布局方面构建的区域专利资源评价指标体系能较好的分析对比区域专利资源,同时,主成分分析方法能较客观地对区域专利资源综合实力进行评价。
- 王鹏龙马建霞任珩
- 关键词:指标体系主成分分析方法
- 基于LDA与新兴主题特征分析的新兴主题探测研究被引量:60
- 2014年
- 本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.
- 范云满马建霞
- 关键词:主题模型主题特征
- 利用LDA的领域新兴主题探测技术综述被引量:23
- 2012年
- 以LDA为基础,系统梳理新兴主题探测以及主题趋势探测技术中的LDA以及其他LDA改进主题模型的发展现状。介绍LDA的变分推导和Gibbs抽样两种参数推导算法;总结近年来LDA模型的改进,包括对主题演化建模的主题模型、对文档内容和元数据联合建模的模型、采用在线式学习的主题模型及将LDA和引文分析相结合的主题演化方法等,并对不同的改进模型进行深入对比和分析;梳理NIH-VB、TIARA、VxInsight等几种主要的主题模型可视化技术。最后通过对LDA模型的总结分析,探讨利用LDA模型探测领域新兴主题时的关键研究问题。
- 范云满马建霞
- 关键词:主题模型LDA