您的位置: 专家智库 > >

山西省回国留学人员科研经费资助项目(2012008)

作品数:3 被引量:19H指数:1
相关作者:王文剑郭虎升王丽赵世琛姜高霞更多>>
相关机构:山西大学教育部更多>>
发文基金:山西省回国留学人员科研经费资助项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇向量
  • 1篇动态粒度
  • 1篇信息粒
  • 1篇支持向量
  • 1篇支持向量回归
  • 1篇支持向量回归...
  • 1篇数据拟合
  • 1篇迁移量
  • 1篇文本分类
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇差分

机构

  • 3篇山西大学
  • 1篇教育部

作者

  • 3篇王文剑
  • 1篇郭虎升
  • 1篇姜高霞
  • 1篇赵世琛
  • 1篇王丽

传媒

  • 1篇数据采集与处...
  • 1篇软件学报
  • 1篇计算机科学

年份

  • 1篇2017
  • 1篇2015
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
动态粒度支持向量回归机被引量:17
2013年
粒度支持向量机(granular support vector machine,简称GSVM)可以有效提高支持向量机(support vector machine,简称SVM)的学习效率,但由于经典GSVM通常将粒用个别样本替代,且粒划和学习在不同空间进行,因而不可避免地改变了原始数据分布,从而可能导致泛化能力降低.针对这一问题,通过引入动态层次粒划的方法,设计了动态粒度支持向量回归(dynamical granular support vector regression,简称DGSVR)模型.该方法首先将训练样本映射到高维空间,使得在低维样本空间无法直接得到的分布信息显示出来,并在该特征空间中进行初始粒划.然后,通过衡量样本粒与当前回归超平面的距离,找到含有较多回归信息的粒,并通过计算其半径和密度进行深层次的动态粒划.如此循环迭代,直到没有信息粒需要进行深层粒划时为止.最后,通过动态粒划过程得到的不同层次的粒进行回归训练,在有效压缩训练集的同时,尽可能地使含有重要信息的样本在最终训练集中保留下来.在基准函数数据集及UCI上的回归数据集上的实验结果表明,DGSVR方法能够以较快的速度完成动态粒划的过程并收敛,在保持较高训练效率的同时可有效提高传统粒度支持向量回归机(granular support vector regression machine,简称GSVR)的泛化性能.
郭虎升王文剑
关键词:支持向量回归信息粒
数据拟合中光滑参数的优化被引量:1
2015年
数据的函数化是函数数据分析(Functional Data Analysis,FDA)的基础,也是区别于其它分析方法的关键步骤。数据拟合作为数据函数化的主要方法,通常可转化为损失函数和正则项的优化问题,其中的光滑参数就起着权衡损失和过拟合风险的作用。在光滑参数的选择方法中,广义交叉验证(Generalized Cross-Validation,GCV)是一种通用而且较好的参数选择方法,然而GCV是对离散值进行计算,欲得到较准确的光滑参数仍需做大量的计算。针对此问题,提出拟合优化和差分两种求解策略以提高最优光滑参数的求解效率,并在算法精度及效率方面进行了比较分析。在模拟数据和真实数据上的实验结果表明:两种策略与常用的网格法相比,求解效率有较大提高,且算法精度方面几乎相同,此外差分求解策略在精度方面略优于拟合优化求解策略,而拟合优化求解策略的效率更高。
王丽王文剑姜高霞
一种面向文本分类的特征迁移方法被引量:1
2017年
传统的文本分类方法假设训练集与测试集中的特征词服从相同的概率分布,但在实际应用中,以上假设存在偏差,会影响到最终的分类结果。针对这一情况,本文采用迁移学习,通过计算特征词的迁移量对训练集中向量空间模型进行修正,最终使训练集与测试集中特征词的分布概率趋于一致。将提出的方法应用于中文垃圾邮件过滤与中、英文网页分类中,在CHI统计特征选择基础上进行特征迁移,实验结果表明新方法可以有效消除特征词分布的差异性,使文本分类的各项指标明显提高。
赵世琛王文剑
关键词:文本分类迁移量向量空间模型
共1页<1>
聚类工具0