牟晓伟
- 作品数:2 被引量:2H指数:1
- 供职机构:长春工业大学计算机科学与工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于KNN的Deep Web数据源分类研究被引量:1
- 2015年
- 针对Deep Web的查询需求,文章提出了改进的对Deep Web数据源的分类方法:在对数据源进行分类时,采用了KNN分类算法来进行。由于KNN分类算法的K值选的过大或者过小都会对分类结果产生影响,因此提出了对K值进行优化的改进的KNN算法。文章利用k-means聚类算法来进行聚类,分别计算取得每个类别的k个距离相近的数据并计算这k个数据到聚类中心的距离,把这个距离的倒数作为该数据点对分类结果的贡献值。对训练集进行聚类后返回聚类中心,根据聚类中心计算权重,从而进一步来计算每个类别中k个最近邻贡献值之和S,选取S最大的类别作为测试数据的类别来进行分类,从而可达到比较好的分类效果。
- 牟晓伟刘寒梅
- 关键词:DEEPWEBKNNK-MEANS聚类
- 一种基于垂直数据格式频繁项集挖掘改进算法被引量:1
- 2015年
- 文章提出了一种基于垂直格式的生成有序搜索列表的频繁项集挖掘算法FDSL。该算法可以通过构造一个有序搜索列表,利用深度优先查找策略,可以同时生成候选集以及候选集的支持度,从而在O(n)时间复杂度下,生成相应的频繁项集。实验结果表明,文章提出的算法在与传统的水平格式的Apriori算法以及垂直格式的Eclat算法在不同的支持度阈值上进行了充分的比较后发现,文章提出的算法在时间性能上具有较高的效率。
- 李彤阳王红梅牟晓伟
- 关键词:APRIORI