公共文化服务平台

2025年1月28日星期二

|

欢迎来到佛山市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

安徽省自然科学基金(090412046): 作品数：8 被引量：20H指数：3; 相关作者：周雷唐昊马学森陆慧万海峰更多>>; 相关机构：合肥工业大学教育部安徽财贸学院更多>>; 发文基金：安徽省自然科学基金安徽高校省级自然科学研究基金国家自然科学基金更多>>; 相关领域：自动化与计算机技术天文地球电子电信更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

8篇期刊文章
4篇会议论文

领域

9篇自动化与计算...
2篇电子电信
1篇天文地球
1篇机械工程
1篇理学

主题

6篇Q学习
3篇优化控制
3篇网络
2篇多AGENT...
1篇多AGENT
1篇多AGENT...
1篇多工序
1篇信息提取
1篇性能函数
1篇性商
1篇学习算法
1篇站点
1篇知识规则
1篇中继
1篇中继选择
1篇中继选择算法
1篇神经网
1篇神经网络
1篇水体信息
1篇水体信息提取

机构

12篇合肥工业大学
2篇安徽财贸学院
2篇教育部
1篇河海大学

作者

8篇周雷
6篇唐昊
2篇孔凤
2篇陆慧
2篇马学森
1篇韩江洪
1篇魏振春
1篇柴雪霞
1篇任玲
1篇张建军
1篇苏红
1篇张晓艳
1篇江琦
1篇任付彪
1篇郭一明
1篇刘冰
1篇曹明
1篇万海峰

传媒

2篇合肥工业大学...
1篇自动化学报
1篇电子技术（上...
1篇控制理论与应...
1篇计算机应用
1篇计算机工程与...
1篇地理空间信息
1篇第三十届中国...

年份

2篇2013
1篇2012
5篇2011
4篇2010

共 8 条记录，以下是 1-10

全选清除导出

排序方式：

多Agent系统连续时间Option算法: 传统用于解决多Agent系统的分层强化学习（Hierachical Reinforcement Learning,HRL）,基本上是建立在离散时间多Agent半马尔科夫决策过程（Discrete Time Multi-A...; 张晓艳唐吴韩江洪周雷; 关键词：分层强化学习 OPTION; 文献传递

基于Q学习的劣化系统检测与维修问题求解: 针对离散状态连续时间下的劣化系统检测与维修问题,本文建立了半马尔科夫决策过程(Semi-MarkovDecisionProcess,SMDP)模型。由于状态的转移概率难以求解,以及为了避免结果陷入局部最优值,本文使用Q学...; 郭一明周雷唐昊史久根; 关键词：劣化系统 Q学习模拟退火; 文献传递

基于多Agent的季节性商品动态定价算法被引量：2: 2011年; 研究两个提供商销售季节性商品时的最优定价策略问题。在性能势理论的基础上,针对季节性商品的特殊属性,建立两个提供商之间没有信息交互情况下的季节性商品的动态定价模型,并引入了Q学习算法和Wolf-PHC算法。通过仿真实验对DF方法定价,Q学习算法定价和Wolf-PHC算法定价进行比较,得到Wolf-PHC算法定价的优化效果更明显,适应性更强。; 陆慧; 关键词：季节性商品 Q学习算法

无线协作网络中的能量有效性中继选择算法被引量：1: 2013年; 研究了无线协作网络中的中继选择问题,允许中继具有缓存数据的能力,提出了一种带有buffer的能量有效性中继选择算法,以延长网络生命周期并提高系统吞吐量。该算法综合考虑链路信息,中继的队列状态以及节点的剩余能量信息,通过加权效用公式选择最优接收数据中继与最优发送数据中继。考虑源节点与中继节点间的功率分配,以降低因源节点到中继节点以及中继节点到目的节点间的信道速率不一致所引起的系统丢包率。仿真实验结果表明,该算法有效地延长了网络的生命周期,随着中继个数的增加网络吞吐量有明显的提高,考虑功率分配后,有效降低了系统丢包率。; 苏红唐昊周雷江琦; 关键词：中继选择网络吞吐量网络生命周期功率分配

基于在线支持向量机的CSPS优化控制: 研究传送带给料生产加工站(Conveyor-Serviced Production Station,CSPS)系统的最优控制问题,其优化目标是通过合理选择站点的前视(look-ahead)控制策略,实现系统的长远期望代价...; 孔凤周雷唐昊; 关键词：Q学习; 文献传递

小脑模型关节控制器网络在传送带给料生产加工站学习优化控制中的应用被引量：3: 2011年; 研究单站点传送带给料生产加工站(conveyor-serviced production station,CSPS)系统的前视(look-ahead)距离最优控制问题,以提高系统的工作效率.论文运用半Markov决策过程对CSPS优化控制问题进行建模.考虑传统Q学习难以直接处理CSPS系统前视距离为连续变量的优化控制问题,将小脑模型关节控制器网络的Q值函数逼近与在线学习技术相结合,给出了在线Q学习及模型无关的在线策略迭代算法.仿真结果表明,文中算法提高了学习速度和优化精度.; 周雷孔凤唐昊张建军; 关键词：小脑模型关节控制器 Q学习

一种能量高效的无线传感器网络自适应传输方法: 针对当前大多数无线传感器网络传输协议不能高效利用传感器节点能量的问题,提出了一种基于信道和缓冲区状态的自适应传输方法,包括基于信道和缓冲区的传输机制（Channel and Buffer Based Transmissi...; 任玲唐昊周雷魏振春; 关键词：无线传感器网络 CBT Q学习; 文献传递

基于CMAC神经网络的多工序CSPS系统分层优化控制: 2012年; 研究带有柔性站点的多工序传送带给料加工站系统的优化控制问题。根据系统运行特点,文章把系统分为切换控制和Look-ahead协同控制两层决策。首先,对于上层的柔性站点切换控制问题,根据CMAC神经网络收敛速度快,适应能力强的特点,采用基于CMAC神经网络的Q学习算法进行策略优化,解决工序间控制问题;其次,对于下层的Look-ahead协同控制问题,运用Wolf-PHC多Agent学习算法,解决工序内协同问题。实验结果表明,通过引入柔性站点建立两层决策体系,整个系统的工件处理率明显提高,基于CMAC神经网络的Q学习算法收敛速度更快,空间复杂度更低。; 刘冰唐昊周雷; 关键词：多工序多AGENT系统 CMAC

基于多Agent强化学习的多站点CSPS系统的协作Look-ahead控制被引量：8: 2010年; 研究多站点传送带给料生产加工站(Conveyor-serviced production station,CSPS)系统的最优控制问题,其优化目标是通过合理选择每个CSPS的Look-ahead控制策略,实现整个系统的工件处理率最大.本文首先根据多Agent系统的反应扩散思想,对每个Agent的原始性能函数进行改进,引入了具有扩散功能的局域信息交互项(原始项看作具有反应功能);并运用性能势理论,构建一种适用于平均和折扣两种性能准则的Wolf-PHC多Agent学习算法,以求解决策时刻不同步的多站点的协作Look-ahead控制策略.最后,论文通过仿真实验验证了该算法的有效性,学习结果表明,通过性能函数的改进,各工作站的负载平衡性得到改善,整个系统的工件处理率也明显提高.; 唐昊万海峰韩江洪周雷; 关键词：多AGENT强化学习性能函数

基于ETM^+和ASTER近红外波段的水体信息提取对比被引量：2: 2013年; 利用Landsat ETM+和ASTER近红外波段数据进行了水体信息提取,然后利用知识规则对2种提取结果进行进一步分类,并分析了波谱分辨率的差异对水体信息提取结果的影响。实验表明,基于Landsat ETM+数据的水体提取总体精度为82.4%,基于ASTER数据的水体信息提取结果总体精度为92.4%;在空间分辨率相同情况下,波谱分辨率的提高可以有效地提高水体信息提取的精度。; 陆慧曹明; 关键词：ASTER 水体信息知识规则

全选清除导出

共2页<1 2>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有：重庆维普资讯有限公司 ©2014－2017，客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张