您的位置: 专家智库 > >

博士科研启动基金(00194)

作品数:1 被引量:0H指数:0
相关作者:唐昊代桂平奚宏生更多>>
相关机构:合肥工业大学中国科学技术大学北京工业大学更多>>
发文基金:博士科研启动基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇神经元动态规...
  • 1篇半MARKO...

机构

  • 1篇合肥工业大学
  • 1篇北京工业大学
  • 1篇中国科学技术...

作者

  • 1篇奚宏生
  • 1篇代桂平
  • 1篇唐昊

传媒

  • 1篇控制理论与应...

年份

  • 1篇2006
1 条 记 录,以下是 1-1
排序方式:
随机平稳策略下半Markov决策过程的仿真优化算法
2006年
基于性能势理论和等价Markov过程方法,研究了一类半Markov决策过程(SMDP)在参数化随机平稳策略下的仿真优化算法,并简要分析了算法的收敛性.通过SMDP的等价Markov过程,定义了一个一致化Markov链,然后根据该一致化Markov链的单个样本轨道来估计SMDP的平均代价性能指标关于策略参数的梯度,以寻找最优(或次优)策略.文中给出的算法是利用神经元网络来逼近参数化随机平稳策略,以节省计算机内存,避免了“维数灾”问题,适合于解决大状态空间系统的性能优化问题.最后给出了一个仿真实例来说明算法的应用.
代桂平唐昊奚宏生
关键词:神经元动态规划
共1页<1>
聚类工具0