安徽省自然科学基金(090412046) 作品数:8 被引量:20 H指数:3 相关作者: 周雷 唐昊 马学森 陆慧 万海峰 更多>> 相关机构: 合肥工业大学 教育部 安徽财贸学院 更多>> 发文基金: 安徽省自然科学基金 安徽高校省级自然科学研究基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 天文地球 电子电信 更多>>
多Agent系统连续时间Option算法 传统用于解决多Agent系统的分层强化学习(Hierachical Reinforcement Learning,HRL),基本上是建立在离散时间多Agent半马尔科夫决策过程(Discrete Time Multi-A... 张晓艳 唐吴 韩江洪 周雷关键词:分层强化学习 OPTION 文献传递 基于Q学习的劣化系统检测与维修问题求解 针对离散状态连续时间下的劣化系统检测与维修问题,本文建立了半马尔科夫决策过程(Semi-MarkovDecisionProcess,SMDP)模型。由于状态的转移概率难以求解,以及为了避免结果陷入局部最优值,本文使用Q学... 郭一明 周雷 唐昊 史久根关键词:劣化系统 Q学习 模拟退火 文献传递 基于多Agent的季节性商品动态定价算法 被引量:2 2011年 研究两个提供商销售季节性商品时的最优定价策略问题。在性能势理论的基础上,针对季节性商品的特殊属性,建立两个提供商之间没有信息交互情况下的季节性商品的动态定价模型,并引入了Q学习算法和Wolf-PHC算法。通过仿真实验对DF方法定价,Q学习算法定价和Wolf-PHC算法定价进行比较,得到Wolf-PHC算法定价的优化效果更明显,适应性更强。 陆慧关键词:季节性商品 Q学习算法 无线协作网络中的能量有效性中继选择算法 被引量:1 2013年 研究了无线协作网络中的中继选择问题,允许中继具有缓存数据的能力,提出了一种带有buffer的能量有效性中继选择算法,以延长网络生命周期并提高系统吞吐量。该算法综合考虑链路信息,中继的队列状态以及节点的剩余能量信息,通过加权效用公式选择最优接收数据中继与最优发送数据中继。考虑源节点与中继节点间的功率分配,以降低因源节点到中继节点以及中继节点到目的节点间的信道速率不一致所引起的系统丢包率。仿真实验结果表明,该算法有效地延长了网络的生命周期,随着中继个数的增加网络吞吐量有明显的提高,考虑功率分配后,有效降低了系统丢包率。 苏红 唐昊 周雷 江琦关键词:中继选择 网络吞吐量 网络生命周期 功率分配 基于在线支持向量机的CSPS优化控制 研究传送带给料生产加工站(Conveyor-Serviced Production Station,CSPS)系统的最优控制问题,其优化目标是通过合理选择站点的前视(look-ahead)控制策略,实现系统的长远期望代价... 孔凤 周雷 唐昊关键词:Q学习 文献传递 小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用 被引量:3 2011年 研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度. 周雷 孔凤 唐昊 张建军关键词:小脑模型关节控制器 Q学习 一种能量高效的无线传感器网络自适应传输方法 针对当前大多数无线传感器网络传输协议不能高效利用传感器节点能量的问题,提出了一种基于信道和缓冲区状态的自适应传输方法,包括基于信道和缓冲区的传输机制(Channel and Buffer Based Transmissi... 任玲 唐昊 周雷 魏振春关键词:无线传感器网络 CBT Q学习 文献传递 基于CMAC神经网络的多工序CSPS系统分层优化控制 2012年 研究带有柔性站点的多工序传送带给料加工站系统的优化控制问题。根据系统运行特点,文章把系统分为切换控制和Look-ahead协同控制两层决策。首先,对于上层的柔性站点切换控制问题,根据CMAC神经网络收敛速度快,适应能力强的特点,采用基于CMAC神经网络的Q学习算法进行策略优化,解决工序间控制问题;其次,对于下层的Look-ahead协同控制问题,运用Wolf-PHC多Agent学习算法,解决工序内协同问题。实验结果表明,通过引入柔性站点建立两层决策体系,整个系统的工件处理率明显提高,基于CMAC神经网络的Q学习算法收敛速度更快,空间复杂度更低。 刘冰 唐昊 周雷关键词:多工序 多AGENT系统 CMAC 基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制 被引量:8 2010年 研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高. 唐昊 万海峰 韩江洪 周雷关键词:多AGENT强化学习 性能函数 基于ETM^+和ASTER近红外波段的水体信息提取对比 被引量:2 2013年 利用Landsat ETM+和ASTER近红外波段数据进行了水体信息提取,然后利用知识规则对2种提取结果进行进一步分类,并分析了波谱分辨率的差异对水体信息提取结果的影响。实验表明,基于Landsat ETM+数据的水体提取总体精度为82.4%,基于ASTER数据的水体信息提取结果总体精度为92.4%;在空间分辨率相同情况下,波谱分辨率的提高可以有效地提高水体信息提取的精度。 陆慧 曹明关键词:ASTER 水体信息 知识规则