浙江省科技厅项目(2006c13096)
- 作品数:3 被引量:18H指数:2
- 相关作者:钱徽朱淼良陈鹏陈沈轶金卓军更多>>
- 相关机构:浙江大学安徽师范大学更多>>
- 发文基金:浙江省科技厅项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于回报函数逼近的学徒学习综述被引量:1
- 2008年
- 回顾了基于回报函数逼近的学徒学习的发展历史,介绍了目前的主要工作,总结了学徒学习的一般方法,讨论了线性和非线性假设条件下的回报函数求解,比较了逆向增强学习(IRL)和边际最大化(MMP)两类逼近方法.基于IRL的学徒学习是一种通过迭代的方法用基回报函数的线性组合来逼近真实回报函数的过程.MMP方法可以看作是一类基于梯度下降的最优化方法.综合采用滤波及将策略函数概率化等方法可以降低对专家演示的最优要求.最后指出了该领域存在的问题,提出了未来的研究方向,如在部分可观察马尔可夫决策过程框架下的学徒学习及对不确定策略的学习等.
- 金卓军钱徽陈沈轶朱淼良
- 一种快速高斯粒子滤波算法被引量:9
- 2008年
- 为改善高斯粒子滤波(GPF)算法的实时性,研究了一种快速的GPF算法.在GPF的预测及更新步骤中用初始粒子群的线性变换取代高斯分布采样,以降低生成新粒子群所需时间,提高滤波算法的运行速度.对两种生成粒子群方法的复杂度及粒子群所代表的分布进行了分析,分析结果表明:线性变换法和高斯采样法生成的粒子群所代表的分布相同,且线性变换法的运行效率更高.将粒子滤波算法(PF),GPF算法及改进后的GPF算法分别应用于一维的一种离散时变非线性模型和二维的基于角度目标跟踪(BOT)模型,仿真结果表明:改进后GPF算法预测性能不变,速度得到了提高,生成1 000个粒子平均需时22 ms,比GPF算法减少了6 ms.
- 陈鹏钱徽朱淼良
- 关键词:非线性系统蒙特卡罗方法
- 基于加权最小二乘的卡尔曼滤波算法被引量:8
- 2009年
- 为了将卡尔曼滤波(KF)应用于非线性系统中,利用了离散采样点将非线性模型线性化。通过加权最小二乘原理,得到近似的线性化模型,再将KF算法应用于这个线性模型中。结果表明,加权最小二乘与KF结合的方法在非线性模型中的计算结果同扩展卡尔曼滤波(EKF)算法接近,且不需要EKF那样求偏导就能很容易地应用到非线性系统中。这种方法实现容易,预测可靠,具有实际应用的价值。
- 陈鹏钱徽朱淼良
- 关键词:非线性系统采样