您的位置: 专家智库 > >

毕华

作品数:3 被引量:41H指数:1
供职机构:中国科学院自动化研究所更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 1篇噪音数据
  • 1篇重采样
  • 1篇自助
  • 1篇自助法
  • 1篇维数
  • 1篇维数约简
  • 1篇稳健性
  • 1篇BOOSTI...
  • 1篇采样

机构

  • 3篇中国科学院自...

作者

  • 3篇毕华
  • 2篇王珏
  • 1篇梁洪力

传媒

  • 1篇模式识别与人...
  • 1篇计算机学报

年份

  • 2篇2009
  • 1篇2008
3 条 记 录,以下是 1-3
排序方式:
维数约简中的数据性质研究
维数约简是机器学习领域中一个重要的研究方向。近年来,高维海量不可控数据的现状,维数约简算法又一次成为人们关注的焦点。   高维数据使我们不得不面对维数灾难(Curses of Dimensionality)问题,维数的...
毕华
一种近邻局部学习的稳健性分析
2008年
在统计推断中,稳健性是指实际问题的数据来源与我们的模型假定有偏离时,所采用算法的结果受到的扰动很小,并且保持算法的预测性能.本文将统计稳健性的研究方法引入机器学习中,分析得到近邻估计这种局部学习能够在大样本的情形下收敛到 Bayes 最优估计,同时收敛条件可说明近邻估计是稳健估计.在模拟数据和真实数据库上进行实验,结果表明在某些离群点影响模型的情况下,仍保持监督学习预测的泛化性能.
毕华王珏
关键词:稳健性噪音数据
重采样方法与机器学习被引量:41
2009年
Boosting算法试图用弱学习器的线性组合逼近复杂的自然模型,以其优秀的可解释性和预测能力,得到了计算机界的高度关注.但Boosting只被看作是一种特定损失下的优化问题,其统计学本质未曾得到充分的关注.作者追根溯源,提出从统计学角度看待Boosting方法:在统计学框架下,Boosting算法仅仅是重采样方法的一个有趣的特例.作者希望改变计算机科学家只重视算法性能忽略数据性质的现状,以期找到更适合解决"高维海量不可控数据"问题的方法.
毕华梁洪力王珏
关键词:重采样自助法BOOSTING
共1页<1>
聚类工具0