粒度支持向量机(granular support vector machine,简称GSVM)可以有效提高支持向量机(support vector machine,简称SVM)的学习效率,但由于经典GSVM通常将粒用个别样本替代,且粒划和学习在不同空间进行,因而不可避免地改变了原始数据分布,从而可能导致泛化能力降低.针对这一问题,通过引入动态层次粒划的方法,设计了动态粒度支持向量回归(dynamical granular support vector regression,简称DGSVR)模型.该方法首先将训练样本映射到高维空间,使得在低维样本空间无法直接得到的分布信息显示出来,并在该特征空间中进行初始粒划.然后,通过衡量样本粒与当前回归超平面的距离,找到含有较多回归信息的粒,并通过计算其半径和密度进行深层次的动态粒划.如此循环迭代,直到没有信息粒需要进行深层粒划时为止.最后,通过动态粒划过程得到的不同层次的粒进行回归训练,在有效压缩训练集的同时,尽可能地使含有重要信息的样本在最终训练集中保留下来.在基准函数数据集及UCI上的回归数据集上的实验结果表明,DGSVR方法能够以较快的速度完成动态粒划的过程并收敛,在保持较高训练效率的同时可有效提高传统粒度支持向量回归机(granular support vector regression machine,简称GSVR)的泛化性能.
数据的函数化是函数数据分析(Functional Data Analysis,FDA)的基础,也是区别于其它分析方法的关键步骤。数据拟合作为数据函数化的主要方法,通常可转化为损失函数和正则项的优化问题,其中的光滑参数就起着权衡损失和过拟合风险的作用。在光滑参数的选择方法中,广义交叉验证(Generalized Cross-Validation,GCV)是一种通用而且较好的参数选择方法,然而GCV是对离散值进行计算,欲得到较准确的光滑参数仍需做大量的计算。针对此问题,提出拟合优化和差分两种求解策略以提高最优光滑参数的求解效率,并在算法精度及效率方面进行了比较分析。在模拟数据和真实数据上的实验结果表明:两种策略与常用的网格法相比,求解效率有较大提高,且算法精度方面几乎相同,此外差分求解策略在精度方面略优于拟合优化求解策略,而拟合优化求解策略的效率更高。