陕西省教育厅科研计划项目(06JK248)
- 作品数:9 被引量:58H指数:3
- 相关作者:杨君锐刘南艳张小艳兰天李强更多>>
- 相关机构:西安科技大学更多>>
- 发文基金:陕西省教育厅科研计划项目陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术天文地球文化科学更多>>
- 中文主观题自动批改中相似句子检索算法被引量:3
- 2007年
- 学生答案与标准答案语义匹配程度的计算是基于中文文字类主观题自动批改中的关键问题.提出了学生答案与标准答案匹配程度的计算分两步进行:候选相似语句的检索和基于语义依存的句子相似度计算.利用动态规划法实现候选语句检索,确定数量不多但有可能与标准答案相似的候选句子,然后对标准答案中的句子与少量的候选句子进行深层的句法分析,找出依存关系,并在依存分析结果的基础上进行语义相似度计算,得出最终的结果.该方法可以提高主观题自动批改的效率及准确性,具有一定的实用价值.
- 张小艳
- 关键词:自动批改动态规划法语义相似度
- 一种关联规则增量更新算法被引量:4
- 2009年
- 关联规则是数据挖掘领域的一个重要分支,而发现频繁项目集是关联规则数据挖掘中的关键问题。频繁项目集是在给定的交易数据库D下满足最小支持度和最小置信度下的一个项目集合,但随着数据集的增减,就会产生不同的频繁项目集。如何发现在数据集变化情况下频繁项目集快速和高效地更新是文中解决的问题。为此提出了一种改进的增量更新算法,实验结果表明此算法有较好的效果。
- 兰天杨君锐
- 关键词:数据挖掘关联规则频繁项目集
- 加权最大频繁项目集挖掘算法被引量:2
- 2008年
- 关联规则是数据挖掘领域的一个重要分支,而发现最大频繁项目集是关联规则挖掘中的重要问题.最大频繁项目集挖掘是在数据库中各属性之间是平等的情况下进行的,但现实中并非如此.频繁模式树(Frequent Pattern Tree,FP-Tree)已不能满足要求.为此提出了一个有效的基于加权FP-Tree的加权最大频繁项目集挖掘算法,其挖掘过程中不需要产生候选项目集.并通过实例说明了此算法的挖掘过程.实验结果表明此算法是有效的并且有较好的扩展性.
- 杨君锐兰天刘南艳
- 关键词:数据挖掘关联规则
- 基于SVM的分类方法综述被引量:26
- 2008年
- 本文介绍了文本分类的起源,常用的几类文本分类方法及基于SVM(Support Vector Machines)文本分类的基本原理和方法。并在分析文本分类的特点的基础上比较了在文本分类中应用SVM的优势及存在的问题。最后总结出了SVM在文本分类中应用的两个主要研究方向。
- 张小艳李强
- 关键词:支持向量机文本分类
- 论文本分类中特征选择方法被引量:3
- 2009年
- 文本分类技术在信息过滤和信息检索中有着重要应用。文本表示技术是文本分类中的首要任务,特征选择技术又是文本表示中的核心技术,对分类效果起着至关重要的作用。本文介绍了文本表示和特征选择技术的发展,并在详细分析目前各种文本表示和特征选择的方法和技术特点基础上,比较了各种方法的适用性和优缺点,最后总结出了文本表示和特征选择技术研究的方向和目标。
- 张小艳宋丽平
- 关键词:文本分类文本表示语义特征
- 基于前缀树的数据流频繁模式挖掘算法被引量:2
- 2010年
- 针对数据流的无限性和流动性特点,提出了一种基于前缀树的数据流频繁模式挖掘算法(Prefix-stream).该算法将对数倾斜时间窗口划分为若干个子窗口,以子窗口为单位,利用提出的数据结构Prefix-tree进行挖掘,在整个数据流的频繁模式挖掘中,使得频繁模式挖掘和更新能在Prefix-tree中同时进行.该算法应用对数倾斜时间窗口逐步降低历史事务的权重,从而区分最近事务与历史事务.实验结果表明Prefix-stream具有较高的效率与较好的可扩展性.
- 杨君锐黄威
- 关键词:数据挖掘数据流频繁模式挖掘频繁模式树
- 数字地面模型的建立与应用被引量:16
- 2006年
- 通过阐述数字高程模型(DEM)的一般概念,研究了DEM的建立过程,还对DEM的数据采集过程和数据结构作了详细的阐述,研制开发了DEM在实际工程中应用的多项功能软件,包括简单的土方量的计算、绘制剖面图、绘制三维格网图、计算表面积并对坡度的表面积进行统计等,给出了利用OpenGL绘制三维格网图和坡度的表面积统计.
- 刘南艳翟玲
- 关键词:OPENGL剖面图土方量表面积数字高程模型
- 基于位对象的最大频繁模式挖掘算法被引量:1
- 2008年
- 提出了基于位对象的最大频繁模式挖掘算法.算法中,用位对象表示数据,并用位对象概念改进FP-Tree.用深度优先搜索策略,通过压缩数据库,并用位对象的特性简化模式支持度的计数,使挖掘时不需产生条件FP-Tree和候选项目集,以提高最大频繁模式的挖掘效率.实验结果验证了BFP-Miner的有效性.
- 杨君锐张铁军刘南艳
- 关键词:数据挖掘关联规则最大频繁模式
- 一种最大频繁项集的增量更新算法被引量:1
- 2007年
- 提出了一种基于最小支持度变化的挖掘最大频繁项集的增量式更新算法MFIU(Maximum Frequent Itemsets Updating).针对最大频繁项集更新时的特性,分别对最小支持度变大和变小提出了两种不同的处理方法,对于最小支持度变大的复杂情况,采取了分块的更新策略,并为减少不必要的候选项集,利用了如果X是一个最大频繁项集,则其所有子集都是频繁项集,但都不可能是最大频繁项集,而进行了独特的剪枝方法.最后通过实例分析了该算法.
- 杨君锐刘南艳
- 关键词:数据挖掘关联规则最大频繁项集最小支持度