国家自然科学基金(61103129)
- 作品数:10 被引量:77H指数:4
- 相关作者:钱雪忠宋威吴志媛赵建芳贾志伟更多>>
- 相关机构:江南大学成都信息工程大学更多>>
- 发文基金:国家自然科学基金江苏省科技支撑计划项目江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于PLSI的标签聚类研究被引量:4
- 2013年
- 针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜在语义下的条件概率,生成概率向量;在此基础上,提出凝聚式层次k中心点(hierarchical agglomerative K-mediods,HAK-mediods)聚类算法对概率向量进行聚类,并进行了相关对比实验。实验结果表明,HAK-mediods算法的聚类效果要好于传统的聚类算法,从而验证了该算法的可行性和有效性。
- 吴志媛钱雪忠
- 关键词:大众分类
- 基于资源分配网络和语义特征选取的文本分类被引量:4
- 2014年
- 针对资源分配网络(RAN)算法存在隐含层节点受初始学习数据影响大、收敛速度低等问题,提出一种新的RAN学习算法。通过均值算法确定初始隐含层节点,在原有的"新颖性准则"基础上增加RMS窗口,更好地判定隐含层节点是否增加。同时,采用最小均方(LMS)算法与扩展卡尔曼滤波器(EKF)算法相结合调整网络参数,提高算法学习速度。由于基于词向量空间文本模型很难处理文本的高维特性和语义复杂性,为此通过语义特征选取方法对文本输入空间进行语义特征的抽取和降维。实验结果表明,新的RAN学习算法具有学习速度快、网络结构紧凑、分类效果好的优点,而且,在语义特征选取的同时实现了降维,大幅度减少文本分类时间,有效提高了系统分类准确性。
- 何晓亮宋威梁久祯
- 关键词:最小均方算法文本分类
- 基于约束投影的近邻传播聚类算法被引量:4
- 2014年
- 提出了一种基于约束投影的近邻传播AP聚类算法。AP算法是在数据点相似度矩阵的基础上进行聚类的,很多传统的聚类方法都无法与其相媲美。但是,对于结构复杂的数据,AP算法往往得不到理想的结果。文中算法先对约束信息进行扩展,然后利用扩展的约束信息指导投影矩阵的获取,在低维空间中,利用约束信息对聚类结果进行修正。实验表明,文中算法与对比算法相比,时间性能更优,聚类效果更佳。
- 钱雪忠赵建芳贾志伟
- 关键词:聚类约束信息
- 基于网页概率潜在语义信息的用户兴趣聚类被引量:2
- 2014年
- 为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK-medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK-medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。
- 钱雪忠吴志媛
- 关键词:概率潜在语义分析个性化服务
- 改进的GK聚类算法被引量:4
- 2012年
- 针对传统GK聚类算法无法自动确定聚类数和对初始聚类中心比较敏感的缺陷,提出一种改进的GK聚类算法。该算法首先通过基于类间分离度和类内紧致性的权和的新有效性指标来确定最佳聚类数;然后,利用改进的熵聚类的思想来确定初始聚类中心;最后,根据判定出的聚类数和新的聚类中心进行聚类。实验结果表明,新指标能准确地判断出类间有交叠的数据集的最佳聚类数,且改进后的算法具有更高的聚类准确率。
- 张妨妨钱雪忠
- 关键词:聚类数聚类有效性指标初始聚类中心
- Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法被引量:45
- 2016年
- 针对基于密度的DBSCAN算法对于输入参数敏感、无法聚类多密度数据集等问题,提出了一种贪心的DBSCAN改进算法(greedy DBSCAN)。算法仅需输入一个参数Min Pts,采用贪心策略自适应地寻找Eps半径参数进行簇发现,利用相对稠密度识别和判定噪声数据,在随机寻找核对象过程中使用邻域查询方式提升算法效率,最终通过簇的合并产生最终的聚类结果。实验结果表明,改进后的算法能有效地分离噪声数据,识别多密度簇,聚类准确度较高。
- 冯振华钱雪忠赵娜娜
- 关键词:贪心策略噪声数据DBSCAN聚类
- 基于SURF特征点的多人脸跟踪方法研究被引量:2
- 2015年
- 针对视频序列中多目标人脸跟踪问题,提出一种基于SURF(Speed-Up Robust Features)特征和KLT(Kanade-Lucas-Tomasi)匹配算法相结合的特征点跟踪方法。通过融合该方法,创新性地设计了一种多人脸跟踪系统框架,在目标出现明显的姿态、尺寸变化,或者遭遇局部遮挡、光照不充分等复杂环境干扰下,能够实现对目标人脸稳定跟踪。通过多组实验数据的对比,证明了该跟踪方法比Mean shift算法、传统KLT算法具有更好的鲁棒性,能获得更精确的运动信息;验证了多人脸跟踪系统能够在复杂环境下实现对多人脸的有效跟踪。
- 稂龙亚钱雪忠
- 关键词:SURF算法特征点匹配特征点提取
- 基于凸壳的约束信息扩展方法
- 2014年
- 提出了一种新的约束信息扩展方法。该方法先利用给定的标记信息建立凸壳,然后扫描整个数据集,选择在凸壳内的数据点作为候选集并做进一步判断;对于凸壳间的公共数据,采用凸多边形最优三角剖分的方法来确定这些数据最终应加入的标记信息集。该约束信息扩展方法在四类数据集上验证了算法的有效性。
- 赵建芳钱雪忠贾志伟
- 关键词:凸壳
- 基于像素差分基元矩阵的图像检索被引量:4
- 2015年
- 针对图像检索问题,提出一种基于像素差分基元矩阵的图像检索方法。该方法结合图像的颜色特征与纹理特征,在量化后的HSV颜色空间中提出10种基元;通过定义的基元扫描图像,生成像素差分矩阵以及基元过渡矩阵。最后利用统计算法将上述两个矩阵合并为一个像素差分基元矩阵,实现了颜色、纹理以及空间信息等多特征的图像检索。在Corel标准图像数据库中执行图像检索方法间的对比实验,在Corel-4000图像数据库中执行旋转图像检索实验,实验结果表明,该方法不仅具有良好的检索表现,而且可以实现旋转图像的检索。
- 朱华东宋威
- 关键词:基元图像检索
- 基于GA优化QPSO算法的文本聚类被引量:8
- 2014年
- 针对量子行为粒子群优化算法中粒子搜索的盲目性以及初始聚类中心的选取对聚类结果的影响问题,提出了一种基于GA优化的QPSO聚类算法。该算法首先利用GA稳健的全局优化性能进行快速的粗略聚类,然后用GA的聚类结果初始化QPSO算法,以降低粒子群搜索的盲目性,从而提高QPSO算法的搜索效率。通过在Reuter-21578真实的文本数据集上实验,该算法在Fmeasure评价标准上获得了较高的查准率和查全率,从而验证了该聚类算法的有效性和可行性,可以在文本聚类领域推广应用。
- 乔莹莹宋威马伟
- 关键词:文本聚类粒子群优化算法量子行为粒子群优化算法遗传算法