朱永华
- 作品数:8 被引量:18H指数:3
- 供职机构:广西师范大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于稀疏学习的自适应近邻分类算法被引量:1
- 2015年
- 为解决k-NN算法中固定k的选定问题,引入稀疏学习和重构技术用于最近邻分类,通过数据驱动(data-driven)获得k值,不需人为设定。由于样本之间存在相关性,用训练样本重构所有测试样本,生成重构系数矩阵,用l1-范数稀疏重构系数矩阵,使每个测试样本用它邻域内最近的k(不定值)个训练样本来重构,解决k-NN算法对每个待分类样本都用同一个k值进行分类造成的分类不准确问题。UCI数据集上的实验结果表明,在分类时,改良k-NN算法比经典k-NN算法效果要好。
- 程德波苏毅娟宗鸣朱永华
- 关键词:数据驱动
- 基于属性自表达的低秩超图属性选择算法
- 2017年
- 针对高维数据具有低秩形式和属性冗余等特点,提出一种基于属性自表达的无监督超图属性选择算法。该算法首先利用属性自表达特点用其他属性稀疏地表达每个属性,此自表达形式使用低秩假设寻找高维数据的低秩表示,然后建立超图正则化因子保持高维数据的局部结构,最后利用稀疏正则化因子进行属性选择。属性自表达特性确定属性的重要性,低秩表示相当于考虑数据的全局信息进行子空间学习,超图正则化因子考虑数据的局部结构对数据进行子空间学习。该算法实际上考虑数据全局和局部信息进行子空间学习,更是一种嵌入了子空间学习的属性选择算法。实验结果表明,该算法相比其他对比算法,能更有效地选取属性,并能取得很好的分类效果。
- 苏毅娟雷聪胡荣耀何威朱永华
- 关键词:子空间学习超图
- 基于稀疏学习的kNN分类被引量:8
- 2016年
- 在kNN算法分类问题中,k的取值一般是固定的,另外,训练样本中可能存在的噪声能影响分类结果。针对以上存在的两个问题,本文提出一种新的基于稀疏学习的kNN分类方法。本文用训练样本重构测试样本,其中,l_1-范数导致的稀疏性用来对每个测试样本用不同数目的训练样本进行分类,这解决了kNN算法固定k值问题;l_(21)-范数产生的整行稀疏用来去除噪声样本。在UCI数据集上进行实验,本文使用的新算法比原来的kNN分类算法能取得更好的分类效果。
- 宗鸣龚永红文国秋程德波朱永华
- 稀疏编码的最近邻填充算法被引量:3
- 2015年
- 针对K最近邻填充算法(K-nearest neighbor imputation,KNNI)的参数K值固定问题进行了研究,发现对缺失值填充时,参数K值固定很大程度上影响了填充效果。为此,提出了基于稀疏编码的最近邻填充算法来解决这一问题。该算法是用训练样本重构每一缺失样本,在重构过程中充分考虑了样本之间的相关性;并用1范数来学习确保每个缺失样本用不同数目的训练样本填充,以此解决KNNI算法参数K值选取问题。基于数据性能分析指标RMSE和相关系数的实验比较结果表明,该算法比KNNI算法的效果要好。该算法能很好地避免了KNNI算法存在的缺陷,适用于数据预处理环节需要对缺失值进行填充的应用领域。
- 苏毅娟程德波宗鸣李凌朱永华
- 关键词:缺失值填充均方根误差相关系数数据预处理
- 一种基于谱旋转的一步谱聚类方法
- 本发明公开了一种基于谱旋转的一步谱聚类方法,涉及计算机大数据信息技术领域,解决的技术问题是提供一种谱聚类步骤精简且聚类准确率高的谱聚类方法,该方法通过将关系矩阵的学习,谱表示的学习,k‑means聚类的优化和转换矩阵的学...
- 朱晓峰童涛朱永华郑威张师超
- 文献传递
- 基于图的特征选择算法在阿兹海默症诊断问题研究被引量:3
- 2017年
- 针对神经性疾病难以确诊的问题,提出了一种基于图的特征选择方法,过滤掉不相干的特征,从而方便并且准确地对疾病患者进行诊断。算法首先基于先验知识定义了两种基本关系(特征关系和样本关系);然后将这两种关系嵌入到一个由最小二次损失函数和l2-范数正则化因子组成的多任务学习框架中进行特征选择;最后,将约简得到的降维矩阵送入支持向量机(SVM)中对阿兹海默症患者进行确诊。通过对Alzheimer’s disease neuroimaging initiative(ANDI)的研究数据集进行实验得知,提出算法的分类效果均优于一般常用分类算法,如K最近邻法(KNN)、支持向量机(SVM)等。提出的算法通过考虑特征选择和引入两种数据的内在关系,有效提高了阿兹海默疾病诊断的正确率。
- 朱永华程德波何威文国秋梁正友
- 基于混合模重构的kNN回归被引量:3
- 2016年
- 对于线性回归中k NN(k-Nearest Neighbor)算法的k值固定问题和训练样本中的噪声问题,提出一种新的基于重构的稀疏编码方法。该方法用训练样本重构每一个测试样本,重构过程中,l_1-范数被用来确保每个测试样本被不同数目的训练样本来预测,以此解决kNN算法固定k值问题;l_(2,1)-范数导致的整行稀疏被用来去除噪声样本,以避免数据集上的噪声对重构产生不利影响。实验在UCI数据集上显示:新的改进算法比原来的kNN算法在线性回归中具有更好的预测效果。
- 龚永红宗鸣朱永华程德波
- 基于子空间学习的嵌入式属性选择方法及其应用
- 本发明的基于子空间学习的嵌入式属性选择方法及其应用,在嵌入式属性选择框架上加入了子空间学习技术,利用子空间技术高效的学习能力改进属性选择进行属性约简的能力。本方法包括1)给定训练集条件属性及对应的类标签,建立一个具有LD...
- 朱永华宗鸣程德波邓振云孙可朱晓峰张师超
- 文献传递