搜索到1175篇“ 神经元动态规划“的相关文章
- 基于神经元动态规划的可重入生产系统调度的仿真框架被引量:4
- 2007年
- 提出一个基于神经元动态规划解决可重入生产系统调度问题的仿真框架.根据可重入生产系统的特点建立状态集,并将调度问题表示成相应的马尔可夫决策过程.选择合理的性能指标,采用神经元动态规划产生每一步的调度,并在仿真中优化策略.仿真算例验证了该方法的有效性,三种调度策略的结果比较表明了神经元动态规划方法的优越性.本仿真框架还可拓展至其他类型的生产调度问题.
- 王颖朱顺痣许威缪克华李茂青
- 关键词:神经元动态规划调度
- 基于仿真的可重入生产系统的神经元动态规划调度研究
- 可重入生产系统是以半导体和薄胶片生产为代表的一类复杂生产系统,在微电子行业飞速发展的今天,可重入生产系统已受到工业界和学术界的广泛关注。 本文对可重入生产系统的描述、模型、性能及调度等方面进行了系统的研究,提出一些新的思...
- 王颖
- 关键词:调度策略
- SMDP基于TD(λ)学习的统一神经元动态规划优化方法
- 本文讨论了半马尔可夫决策过程(SMDP)基于参数学习的性能优化问题.首先通过SMDP的一致链转抉及其性能势的神经元网络逼近,建立了折扣和平均准则下SMDP统一的TD(λ)参数学习公式;然后给出一种基于TD(λ)的神经元动...
- 唐昊周雷陆阳袁继彬
- 关键词:神经元动态规划决策过程性能势
- 神经元动态规划综述被引量:6
- 2001年
- 神经元动态规划是近年发展起来的一种优化方法 .它采用计算机仿真和函数近似 ,简化对状态空间的搜索 ,可以有效克服“维数危机” ,有广阔的应用前景 .本文对神经元动态规划作一综述 。
- 金辉宇于海斌
- 关键词:动态规划神经元动态规划计算机仿真
- Markov控制过程基于神经元动态规划的优化算法被引量:3
- 2001年
- 论文在Markov性能势理论基础上 ,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法 ;分析了它们在一个无限长的样本轨道上以概率 1的收敛性 ;并给出了一个三
- 唐昊奚宏生殷保群
- 关键词:MARKOV控制过程神经元动态规划
- 神经元动态规划在可重入生产系统调度的中的应用
- 该文研究神经元动态规划在重入生产系统调度策略优化中的应用.前三章首先介绍了神经元动态规划和可重入生产系统.为后续章节的研究提供了必要的基础.第四章讨论用神经元动态规划对封闭入生产系统进行优化.作者首先提出了关于优化目标的...
- 金辉宇
- 关键词:调度
- 神经元动态规划在可重入生产系统高度中的应用
- 金辉宇
- 关键词:神经元动态规划调度
- 软件定义网络多媒体服务建模与优化
- 随着互联网技术的发展和服务的完善,网络流量呈现爆炸式增长,摩尔定律下互联网的建设速度已经远远赶不上业务需求增长速度,这其中尤其以多媒体流量最为突出。根据思科调查显示,截止2020年,媒体流量将占据互联网流量的80%。盲目...
- 朱坤杰
- 关键词:多媒体服务MARKOV决策过程近似动态规划神经元动态规划
- SDN中DASH路由规划和码率调节联合决策算法被引量:3
- 2017年
- 随着互联网技术的快速发展以及智能设备的普及,基于HTTP的动态自适应流媒体(Dynamic Adaptive Streaming over HTTP,DASH)业务发展迅速.但在带宽受限网络中,大规模用户的视频请求,将会加重网络负载,严重影响网络带宽资源的有效利用,同时用户码率调节缺乏全局协调控制机制,容易造成网络拥塞.针对软件定义网络中的DASH视频传输业务,将视频业务提供商长期平均收益最大化作为优化目标,设计并实现了基于神经元动态规划的DASH视频路由和用户码率调节联合决策算法.最后,通过在Mininet平台上建立SDN(Software-Defined Networking)网络环境并进行对比实验,我们验证了本文提出的联合决策算法能够提高网络带宽资源利用率,最大化DASH视频业务提供商长期平均收益.
- 姜俊超朱坤杰张云飞杨坚
- 关键词:路由算法神经元动态规划
- 多Agent MDPs中并行Rollout学习算法
- 2014年
- 文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过多级仓库库存控制的仿真试验,验证了Rollout算法在多Agent学习中的有效性.
- 李豹
- 关键词:ROLLOUT算法神经元动态规划多AGENT学习性能势
相关作者
- 唐昊

- 作品数:211被引量:238H指数:8
- 供职机构:合肥工业大学
- 研究主题:性能势 Q学习 柔性负荷 优化控制 调度
- 周雷

- 作品数:80被引量:57H指数:4
- 供职机构:合肥工业大学
- 研究主题:Q学习 外骨骼 性能势 优化控制 半MARKOV决策过程
- 袁继彬

- 作品数:4被引量:13H指数:2
- 供职机构:合肥工业大学计算机与信息学院
- 研究主题:神经元动态规划 性能势 决策过程 MDP MARKOV决策过程
- 陈栋

- 作品数:3被引量:4H指数:1
- 供职机构:合肥工业大学计算机与信息学院
- 研究主题:神经元动态规划 性能势 SMDP 半MARKOV决策过程 网络
- 李豹

- 作品数:16被引量:4H指数:1
- 供职机构:中国人民银行
- 研究主题:性能势 生物油 ROLLOUT算法 神经元动态规划 MARKOV决策过程