刘勘
- 作品数:47 被引量:435H指数:11
- 供职机构:中南财经政法大学信息与安全工程学院更多>>
- 发文基金:教育部人文社会科学研究基金国家社会科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理社会学更多>>
- 数据可视化的研究与发展被引量:154
- 2002年
- 针对数据可视化是可视化技术在大型数据库的应用中提出的新的数据分析和处理技术。该文介绍了数据可视化的概念和发展状况,然后针对大型数据集介绍了几种数据可视化技术以及它们的代表方法,并对数据可视化和科学计算可视化进行了分析和比较,最后探讨了数 据可视化技术的研究发展方向。
- 刘勘周晓峥周洞汝
- 关键词:数据可视化数据库数据仓库
- 基于潜在语义索引的科技文献主题挖掘被引量:4
- 2014年
- 提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文献的主题。该方法利用Frobenius范数来规范矩阵,对稀疏矩阵进行降维,可以快速精确地挖掘出科技文献的主题。
- 刘勘朱芳芳
- 关键词:潜在语义索引主题挖掘
- 基于自动编码器的短文本特征提取及聚类研究被引量:31
- 2015年
- 针对短文本的特点,提出一种基于深层噪音自动编码器的特征提取及聚类算法。该算法利用深度学习网络,将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间。首先在自动编码器的基础上,引入L1范式惩罚项来避免模型过分拟合,然后添加噪音项以提高算法的鲁棒性。实验结果表明,将提取的文本特征应用于短文本聚类,显著提高了聚类的效果,有效地解决了短文本空间向量的高维、稀疏问题。
- 刘勘袁蕴英
- 关键词:特征提取聚类
- 基于随机森林分类的微博机器用户识别研究被引量:19
- 2015年
- 针对网络上机器用户大量散布谣言,发布虚假信息,误导网民舆论,严重影响网络环境的问题,以微博中的机器用户为研究对象,结合其自动化程度高、伪装能力强、信息发布有针对性的特点,从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标,利用信息熵、内容重复率等8个指标构建微博用户的特征向量,通过随机森林算法设计微博中机器用户的识别模型。最后,在真实的新浪微博数据集上进行验证,结果表明本模型识别机器用户的准确度达到96.7%,可以有效地区分微博中的机器用户和普通用户。
- 刘勘袁蕴英刘萍
- 大型数据库中的数据可视化技术
- 本文重点介绍了几种主要的对大型数据集的数据可视化技术包括基于层次的技术、基于几何投影技术、面向象素的技术和基于几何投影技术等,这些技术和方法都有进一步扩展和完善的空间,另外大型数据库中数据的可视化技术在未来的数据库开发和...
- 刘勘周洞汝
- 关键词:大型数据库数据可视化数据分析数据挖掘
- 文献传递
- 基于数据挖掘的课程管理信息系统研究
- 2012年
- 本文设计了一个基于数据挖掘的课程管理系统,采用了关联规则、分类、聚类等几种主要的数据挖掘方法,对学生学习过程中各类数据进行分析,挖掘学生成绩与教学过程中各类课堂数据之间隐藏的关系,为教师教学及学生日后的学习提供指导。
- 刘勘甘小亚
- 关键词:数据挖掘课程管理信息系统
- 一种对学术论文关键词权值的动态调整方法
- 1引言人们要想在众多的网络信息中获取对自己有用的信息,就离不开检索系统。对于学术论文数据库检索系统,如中国期刊网(CNKI)、万方数字化期刊、维普科技期刊数据库等,与一般的文本检索、Web挖掘、搜索引擎、新闻检索等都不同...
- 刘勘刘萍
- 关键词:TFIDFVSM
- 文献传递
- 动态报表实现技术
- 2005年
- 以高等学校统计报表管理系统为应用背景,介绍了如何利用动态数据库技术和自己开发的报表控件,针对报表数据工作流,实现各种复杂报表的设计、管理、查询等功能,使应用程序能较好地适应应用环境的变化.
- 刘腾红刘勘金大卫
- 关键词:数据库动态报表
- 中文微博的立场判别研究被引量:3
- 2017年
- [目的/意义]提出一种以情感加权算法和朴素贝叶斯算法为基础的组合分类模型(SWNB模型),旨在对中文微博话题的立场进行判别。[方法/过程]该模型首先通过给定的复杂句模型对微博进行简化,然后依据情感规则得到情感权值,提取微博中与话题相关的实体并进行优化,进而将微博分为包含立场和未表明立场(NONE)两类;再对包含立场的微博提取特征词,利用朴素贝叶斯算法将其立场判别为支持(FAVOR)或反对(AGAINST)。[结果/结论 ]实验结果表明,本模型有较好的立场判别精度,并能同时有效地处理中文复杂句式、话题相关评价对象以及上下文语境等复杂情形。
- 刘勘田宁梦王宏宇林荣蓉王德民
- 关键词:朴素贝叶斯
- 链路结构的网页聚类研究被引量:1
- 2016年
- 网页的链接关系反映了网页之间联系的紧密程度,这种紧密关系是网页聚类的重要依据.首先通过对网页链路结构的特点分析,提出网页节点的基本集、扩展集、半径、邻域、密度和路径树等概念;然后,利用共享入度出度以及网页之间的相异度来衡量其距离,并结合扩展集中的链接信息设计了网页相似度的计算模型;最后,利用密度分布对网页进行聚类.实验结果表明,本算法具有较好的聚类效果.
- 刘勘范琴
- 关键词:WEB挖掘链接分析网页聚类