您的位置: 专家智库 > >

安徽省自然科学基金(090412046)

作品数:8 被引量:20H指数:3
相关作者:周雷唐昊马学森陆慧万海峰更多>>
相关机构:合肥工业大学教育部安徽财贸学院更多>>
发文基金:安徽省自然科学基金安徽高校省级自然科学研究基金国家自然科学基金更多>>
相关领域:自动化与计算机技术天文地球电子电信更多>>

文献类型

  • 8篇期刊文章
  • 4篇会议论文

领域

  • 9篇自动化与计算...
  • 2篇电子电信
  • 1篇天文地球
  • 1篇机械工程
  • 1篇理学

主题

  • 6篇Q学习
  • 3篇优化控制
  • 3篇网络
  • 2篇多AGENT...
  • 1篇多AGENT
  • 1篇多AGENT...
  • 1篇多工序
  • 1篇信息提取
  • 1篇性能函数
  • 1篇性商
  • 1篇学习算法
  • 1篇站点
  • 1篇知识规则
  • 1篇中继
  • 1篇中继选择
  • 1篇中继选择算法
  • 1篇神经网
  • 1篇神经网络
  • 1篇水体信息
  • 1篇水体信息提取

机构

  • 12篇合肥工业大学
  • 2篇安徽财贸学院
  • 2篇教育部
  • 1篇河海大学

作者

  • 8篇周雷
  • 6篇唐昊
  • 2篇孔凤
  • 2篇陆慧
  • 2篇马学森
  • 1篇韩江洪
  • 1篇魏振春
  • 1篇柴雪霞
  • 1篇任玲
  • 1篇张建军
  • 1篇苏红
  • 1篇张晓艳
  • 1篇江琦
  • 1篇任付彪
  • 1篇郭一明
  • 1篇刘冰
  • 1篇曹明
  • 1篇万海峰

传媒

  • 2篇合肥工业大学...
  • 1篇自动化学报
  • 1篇电子技术(上...
  • 1篇控制理论与应...
  • 1篇计算机应用
  • 1篇计算机工程与...
  • 1篇地理空间信息
  • 1篇第三十届中国...

年份

  • 2篇2013
  • 1篇2012
  • 5篇2011
  • 4篇2010
8 条 记 录,以下是 1-10
排序方式:
多Agent系统连续时间Option算法
传统用于解决多Agent系统的分层强化学习(Hierachical Reinforcement Learning,HRL),基本上是建立在离散时间多Agent半马尔科夫决策过程(Discrete Time Multi-A...
张晓艳唐吴韩江洪周雷
关键词:分层强化学习OPTION
文献传递
基于Q学习的劣化系统检测与维修问题求解
针对离散状态连续时间下的劣化系统检测与维修问题,本文建立了半马尔科夫决策过程(Semi-MarkovDecisionProcess,SMDP)模型。由于状态的转移概率难以求解,以及为了避免结果陷入局部最优值,本文使用Q学...
郭一明周雷唐昊史久根
关键词:劣化系统Q学习模拟退火
文献传递
基于多Agent的季节性商品动态定价算法被引量:2
2011年
研究两个提供商销售季节性商品时的最优定价策略问题。在性能势理论的基础上,针对季节性商品的特殊属性,建立两个提供商之间没有信息交互情况下的季节性商品的动态定价模型,并引入了Q学习算法和Wolf-PHC算法。通过仿真实验对DF方法定价,Q学习算法定价和Wolf-PHC算法定价进行比较,得到Wolf-PHC算法定价的优化效果更明显,适应性更强。
陆慧
关键词:季节性商品Q学习算法
无线协作网络中的能量有效性中继选择算法被引量:1
2013年
研究了无线协作网络中的中继选择问题,允许中继具有缓存数据的能力,提出了一种带有buffer的能量有效性中继选择算法,以延长网络生命周期并提高系统吞吐量。该算法综合考虑链路信息,中继的队列状态以及节点的剩余能量信息,通过加权效用公式选择最优接收数据中继与最优发送数据中继。考虑源节点与中继节点间的功率分配,以降低因源节点到中继节点以及中继节点到目的节点间的信道速率不一致所引起的系统丢包率。仿真实验结果表明,该算法有效地延长了网络的生命周期,随着中继个数的增加网络吞吐量有明显的提高,考虑功率分配后,有效降低了系统丢包率。
苏红唐昊周雷江琦
关键词:中继选择网络吞吐量网络生命周期功率分配
基于在线支持向量机的CSPS优化控制
研究传送带给料生产加工站(Conveyor-Serviced Production Station,CSPS)系统的最优控制问题,其优化目标是通过合理选择站点的前视(look-ahead)控制策略,实现系统的长远期望代价...
孔凤周雷唐昊
关键词:Q学习
文献传递
小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量:3
2011年
研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度.
周雷孔凤唐昊张建军
关键词:小脑模型关节控制器Q学习
一种能量高效的无线传感器网络自适应传输方法
针对当前大多数无线传感器网络传输协议不能高效利用传感器节点能量的问题,提出了一种基于信道和缓冲区状态的自适应传输方法,包括基于信道和缓冲区的传输机制(Channel and Buffer Based Transmissi...
任玲唐昊周雷魏振春
关键词:无线传感器网络CBTQ学习
文献传递
基于CMAC神经网络的多工序CSPS系统分层优化控制
2012年
研究带有柔性站点的多工序传送带给料加工站系统的优化控制问题。根据系统运行特点,文章把系统分为切换控制和Look-ahead协同控制两层决策。首先,对于上层的柔性站点切换控制问题,根据CMAC神经网络收敛速度快,适应能力强的特点,采用基于CMAC神经网络的Q学习算法进行策略优化,解决工序间控制问题;其次,对于下层的Look-ahead协同控制问题,运用Wolf-PHC多Agent学习算法,解决工序内协同问题。实验结果表明,通过引入柔性站点建立两层决策体系,整个系统的工件处理率明显提高,基于CMAC神经网络的Q学习算法收敛速度更快,空间复杂度更低。
刘冰唐昊周雷
关键词:多工序多AGENT系统CMAC
基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制被引量:8
2010年
研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高.
唐昊万海峰韩江洪周雷
关键词:多AGENT强化学习性能函数
基于ETM^+和ASTER近红外波段的水体信息提取对比被引量:2
2013年
利用Landsat ETM+和ASTER近红外波段数据进行了水体信息提取,然后利用知识规则对2种提取结果进行进一步分类,并分析了波谱分辨率的差异对水体信息提取结果的影响。实验表明,基于Landsat ETM+数据的水体提取总体精度为82.4%,基于ASTER数据的水体信息提取结果总体精度为92.4%;在空间分辨率相同情况下,波谱分辨率的提高可以有效地提高水体信息提取的精度。
陆慧曹明
关键词:ASTER水体信息知识规则
共2页<12>
聚类工具0