国家教育部博士点基金(20110095110016) 作品数:5 被引量:29 H指数:3 相关作者: 程玉虎 王雪松 李明 冯涣婷 朱美强 更多>> 相关机构: 中国矿业大学 更多>> 发文基金: 国家教育部博士点基金 国家自然科学基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 农业科学 轻工技术与工程 更多>>
基于相似度衡量的决策树自适应迁移 被引量:9 2013年 如何解决迁移学习中的负迁移问题并合理把握迁移的时机与方法,是影响迁移学习广泛应用的关键点.针对这个问题,提出一种基于相似度衡量机制的决策树自适应迁移方法 (Self-adaptive transfer for decision trees based on a similarity metric,STDT).首先,根据源任务数据集是否允许访问,自适应地采用成分预测概率或路径预测概率对决策树间的相似性进行判定,其亲和系数作为量化衡量关联任务相似程度的依据.然后,根据多源判定条件确定是否采用多源集成迁移,并将相似度归一化后依次分配给待迁移源决策树作为迁移权值.最后,对源决策树进行集成迁移以辅助目标任务实现决策.基于UCI机器学习库的仿真结果说明,与多源迁移加权求和算法(Weighted sum rule,WSR)和MS-TrAdaBoost相比,STDT能够在保证决策精度的前提下实现更为快速的迁移. 王雪松 潘杰 程玉虎 曹戈关键词:决策树 相似度 基于Help-Training的半监督支持向量回归 被引量:6 2012年 提出一种基于Help-Training的半监督支持向量回归算法,包含最小二乘支持向量回归(LS-SVR)和近邻(NN)两种类型学习器.主学习器LS-SVR通过选择高置信度的未标记样本加以标记,并将其添加到已标记样本集,使训练样本的规模不断扩大,以提高LS-SVR的函数逼近性能.辅学习器NN用以协助LS-SVR从训练样本比较密集的区域选取未标记样本加以置信度评估,可以减弱噪声对学习效果的负面影响.实验结果表明所提算法具有良好的回归估计性能,学习精度较高. 程玉虎 冀杰 王雪松关键词:半监督学习 支持向量回归 置信度 基于非负稀疏嵌入投影的高光谱数据降维方法 被引量:2 2012年 针对因数据冗余及Hughes现象带来的高光谱数据分类精度降低问题,提出一种基于样本依赖排斥图的非负稀疏嵌入投影降维(NSEPSRG)算法.首先,利用非负稀疏表示方法,得到样本的非负稀疏重构权重矩阵.然后,利用样本的先验类别信息,构建样本依赖排斥图,有助于避免误分类和提高分类精度.最后,为保持每个样本间的稀疏结构关系和各样本的内在流形结构不变,根据非负稀疏重构权重矩阵和样本依赖排斥图的邻接矩阵,将样本嵌入投影到低维子空间,有助于从高维高光谱数据中提取信息量大的光谱波段,从而使得到的分类图像更清晰、平滑.AVIRIS高光谱数据上的实验结果表明,运用支持向量机对经过NSEPSRG降维处理后的高光谱数据进行分类,分类整体精度和Kappa系数分别达到了87.87%和0.856 6. 高阳 王雪松 程玉虎 黄飞关键词:高光谱数据 降维 一类基于谱方法的强化学习混合迁移算法 被引量:10 2012年 在状态空间比例放大的迁移任务中,原型值函数方法只能有效迁移较小特征值对应的基函数,用于目标任务的值函数逼近时会使部分状态的值函数出现错误.针对该问题,利用拉普拉斯特征映射能保持状态空间局部拓扑结构不变的特点,对基于谱图理论的层次分解技术进行了改进,提出一种基函数与子任务最优策略相结合的混合迁移方法.首先,在源任务中利用谱方法求取基函数,再采用线性插值技术将其扩展为目标任务的基函数;然后,用插值得到的次级基函数(目标任务的近似Fiedler特征向量)实现任务分解,并借助改进的层次分解技术求取相关子任务的最优策略;最后,将扩展的基函数和获取的子任务策略一起用于目标任务学习中.所提的混合迁移方法可直接确定目标任务部分状态空间的最优策略,减少了值函数逼近所需的最少基函数数目,降低了策略迭代次数,适用于状态空间比例放大且具有层次结构的迁移任务.格子世界的仿真结果验证了新方法的有效性. 朱美强 程玉虎 李明 王雪松 冯涣婷关键词:谱图理论