刘芝怡 作品数:20 被引量:69 H指数:5 供职机构: 常州工学院计算机信息工程学院 更多>> 发文基金: 江苏省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
数据挖掘在SQL Server2005中的应用 被引量:11 2006年 本文首先介绍了数据挖掘的概念和处理过程,然后介绍了SQL Server2005中的数据挖掘功能,最后给出了在SQL Server2005中实现数据挖掘项目的整个流程。 刘芝怡 常睿关键词:数据挖掘 SQL 基于单次扫描无构造调节的频繁模式挖掘算法 2014年 研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。 刘芝怡关键词:频繁项集 素数编码 一种智能阅卷方法及系统 本发明公开一种智能阅卷方法及系统,包括以下步骤:步骤1,读取第i个考生登录信息表中第j道试题的试卷代号;步骤2,读取并判断输入的答案与参考答案是否相同;步骤3,若输入的答案与参考答案相同,返回评分;若输入的答案与参考答案... 丁志云 曹中心 刘芝怡 蔡晓丽文献传递 大数据分析技术在海量激光图像检索中的应用 被引量:4 2019年 为解决海量激光图像的检索问题,提出基于大数据分析的海量激光图像检索方法。大数据分析技术中的HDFS采用一个NameNode与数个DataNode组合的运行方式,将海量激光图像特征数据存储在HDFS中;采用基于MapReduce程序与相似度计算方法检索海量激光图像,利用Map读取存储在HDFS中的海量激光图像特征数据,并转换为Key/Value形式的数据特征,在Reduce任务中采用相似度计算方法获取HDFS中海量激光图像特征的形状、纹理、颜色相似度并排序,排序结果则为激光图像检索结果。实验结果表明,所提方法计算的激光图像特征相似度误差较小,检索海量激光图像过程中,所提方法具有高查全率、高查准率的优势,是一种高性能的海量激光图像检索方法。 严伟中 刘芝怡关键词:海量 HDFS 特征相似度 基于FP-forest的并行频繁项集挖掘算法 2014年 在研究传统挖掘频繁项集并行算法的基础上,提出一种以FP-forest为基础的高效能并行挖掘算法FPPMA(FP-forest based high-effect Parallel Mining Algorithm)。此算法中,各运算节点只需要和核心节点之间传递少量信息,而无需和其他运算节点通信,减少了通信费用。此外,运算节点不需要同步和交换数据就可独立挖掘出全局频繁项集。 刘芝怡关键词:关联规则挖掘 基于改进K-means算法的RFAT客户细分研究 被引量:17 2014年 为了解决传统K-means算法对初始聚类中心敏感和聚类数目事先难以确定的问题,提出了一种改进的K-means算法。改进算法利用最大距离等分策略来选取初始聚类中心,并利用一种评价函数来自动确定聚类数,减少了算法结果对参数的依赖。将改进算法应用到某企业客户分类中时,为提高分类结果的表征性,提出了以客户最近购买时间(Recency)、购买频次(Frequency)、平均购买额(Average Monetary)和购买倾向(Trend)作为客户价值细分变量的RFAT(Recency,frequency,average monetary and trend)模型,对客户RFAT值进行了聚类分析,并提供了针对不同客户群的营销策略。实证研究表明,该文所提出的改进算法和模型可以有效地对企业客户进行分类,能充分反映客户的当前价值和增值潜能。 刘芝怡 陈功关键词:客户分类 K-MEANS算法 初始聚类中心 聚类数 结对编程在程序设计语言实践教学中的应用 被引量:2 2011年 结对编程是敏捷地和基于实践的软件开发方法。在程序设计课程的传统实践教学中,学生之间往往缺乏彼此的有效互动,从而不能完成实践教学的任务,甚至失去对课程的信心。笔者提出一种将结对编程运用于程序设计语言实践教学中的方案,并通过实验证明该方案可以有效提高学生的学习效率。 刘芝怡 丁志云关键词:结对编程 计算机语言课程 教学实践 频繁项集高效挖掘算法研究 被引量:2 2012年 为进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究。在此基础上提出了基于frequent-pattern链表的高效频繁项集挖掘算法FPL-Growth。FPL-Growth运用递增构建候选项集策略和Apriori性质来缩小搜索空间,运用交叉计数方法快速获取频繁项集的支持数。最后的实验证明了该算法的有效性。 刘芝怡 常睿关键词:频繁项集 数据挖掘 数据挖掘组件的设计和实现 2009年 如今,以爆炸性速度增长的数据使得人们迫切需要一种自动化的数据挖掘工具用于将大量数据转变为有价值的信息和知识。该文提出一种数据挖掘组件的设计方案,介绍利用数据挖掘组件在MovieClick数据库上进行的数据挖掘实验。 刘芝怡关键词:数据挖掘 一种智能阅卷方法及系统 本发明公开一种智能阅卷方法及系统,包括以下步骤:步骤1,读取第i个考生登录信息表中第j道试题的试卷代号;步骤2,读取并判断输入的答案与参考答案是否相同;步骤3,若输入的答案与参考答案相同,返回评分;若输入的答案与参考答案... 丁志云 曹中心 刘芝怡 蔡晓丽文献传递