2024年12月25日
星期三
|
欢迎来到佛山市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
博士科研启动基金(00194)
作品数:
1
被引量:0
H指数:0
相关作者:
唐昊
代桂平
奚宏生
更多>>
相关机构:
合肥工业大学
中国科学技术大学
北京工业大学
更多>>
发文基金:
博士科研启动基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
相关作品
相关人物
相关机构
相关资助
相关领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
神经元动态规...
1篇
半MARKO...
机构
1篇
合肥工业大学
1篇
北京工业大学
1篇
中国科学技术...
作者
1篇
奚宏生
1篇
代桂平
1篇
唐昊
传媒
1篇
控制理论与应...
年份
1篇
2006
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
随机平稳策略下半Markov决策过程的仿真优化算法
2006年
基于性能势理论和等价Markov过程方法,研究了一类半Markov决策过程(SMDP)在参数化随机平稳策略下的仿真优化算法,并简要分析了算法的收敛性.通过SMDP的等价Markov过程,定义了一个一致化Markov链,然后根据该一致化Markov链的单个样本轨道来估计SMDP的平均代价性能指标关于策略参数的梯度,以寻找最优(或次优)策略.文中给出的算法是利用神经元网络来逼近参数化随机平稳策略,以节省计算机内存,避免了“维数灾”问题,适合于解决大状态空间系统的性能优化问题.最后给出了一个仿真实例来说明算法的应用.
代桂平
唐昊
奚宏生
关键词:
神经元动态规划
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张