山东省高等学校科技计划项目(J12LN45)
- 作品数:4 被引量:10H指数:2
- 相关作者:曾庆田赵华刘彤郝春燕姜姗更多>>
- 相关机构:山东科技大学海信集团有限公司更多>>
- 发文基金:山东省高等学校科技计划项目山东省自然科学基金山东省优秀中青年科学家科研奖励基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一个面向主题的学术文献数据分析工具
- 学术文献数量的迅速增长给科研工作者的文献调研工作带来了巨大的负担,因此设计并实现了一个面向主题的学术文献分析工具,为科研工作者从海量学术文献中快速准确地发现学科研究特性、分析学科发展趋势提供支持.本工具使用Latent ...
- 倪维健柳梅曾庆田刘彤汤建渝
- 关键词:主题模型LDA
- 文献传递
- 基于话题相关空间的微博用户兴趣识别及可视化方法被引量:5
- 2015年
- 微博已经成为获取用户兴趣的有效平台。在分析了用户发表微博的习惯及特点的基础上,提出了一种基于话题相关空间自动构建,同时融合位置信息的微博用户兴趣识别方法。该方法首先基于话题检测技术构建话题相关空间,提出了基于空间范围的TFIDF计算方法,然后融合位置信息计算微博词汇的兴趣表征值,最后采用3D标签云对兴趣识别结果进行了可视化。实验结果表明了所提方法的有效性。
- 赵华纪晓文曾庆田郝春燕
- 关键词:用户兴趣可视化
- 基于PDCA循环和文本挖掘的网络舆情监管方法被引量:3
- 2014年
- 为了完善网络舆情信息的监管机制,使网络舆情能够被有效的梳理和监管,提出了基于PDCA循环和文本挖掘相结合的网络舆情信息监管方法。该方法采用PDCA的计划、执行、检查、改进四个步骤来梳理网络舆情信息监管流程,而在执行阶段则融入文本挖掘方法实现智能决策分析。本文首先分析了目前网络舆情管理的现状,其次给出了基于PDCA循环和文本挖掘的监管方法的实施方案,其中重点阐述了信息获取、热点网络舆情发现、情感倾向性分析等文本挖掘方法在其中的应用。
- 姜姗赵华曾庆田
- 关键词:网络舆情PDCA循环文本挖掘
- 面向搜索引擎查询日志的领域术语自动识别方法被引量:2
- 2016年
- 【目的】为弥补传统基于静态领域语料的领域术语识别方法的不足,提出一种从搜索引擎查询日志中自动识别领域术语的新方法。【方法】使用四部图对查询日志进行抽象描述,并在其上应用流形排序算法得到所有候选术语关于领域度的排序,取排在前列的术语作为领域术语。【结果】在真实搜索引擎的查询日志上实验证实本文方法具有更好的领域术语识别效果,在Precision@n指标上比基准方法提升约20%。【局限】识别到的领域术语的覆盖面部分依赖于领域专家选取的初始查询词,这对领域专家的经验提出一定要求。【结论】该方法无需事先准备大规模领域语料以及大量的人工标注,即可构建高质量的领域术语集合,具有较高的实用价值。
- 刘彤倪维健柳梅
- 关键词:搜索引擎查询日志流形排序
- 一种基于数据迁移的冷启动解决算法
- 2014年
- 在协同过滤技术的实际应用中,提出一种数据迁移和聚类相结合的方法来解决新系统冷启动问题。采用斯皮尔曼秩相关公式度量用户之间的相似度,使用期望最大化聚类算法对原数据集用户进行聚类。对于不同的簇,选取平均打分最高的N个项目作为推荐内容,针对目标数据集的用户,计算用户所属的簇以及对簇的隶属度,按照隶属度比例给用户推荐其所属簇的推荐列表。与TAM算法和CF算法的实验对比结果表明,该算法在解决新系统冷启动问题方面有较好的效果。
- 马远坤梁永全刘彤赵建立李玉军
- 关键词:推荐系统冷启动协同过滤数据迁移期望最大化