陈雪江
- 作品数:5 被引量:22H指数:3
- 供职机构:浙江工业大学信息工程学院更多>>
- 发文基金:浙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于强化学习的多智能体协作实现被引量:2
- 2004年
- 基于马尔科夫过程的强化学习作为一种在线学习方式,能够很好地应用于单智能体环境中。但是由于强化学习理论的限制,在多智能体系统中马尔科夫过程模型不再适用,因此强化学习不能直接用于多智能体的协作学习问题。本文提出了多智能体协作的两层强化学习方法。该方法主要通过在单个智能体中构筑两层强化学习单元来实现。第一层强化学习单元负责学习智能体的联合任务协作策略,第二层强化学习单元负责学习在本智能体看来是最有效的行动策略。所提出的方法应用于3个智能体协作抬起圆形物体的计算机模拟中,结果表明所提出的方法比采用传统强化学习方法的智能体协作得更好。
- 陈雪江杨东勇
- 关键词:多智能体系统习作
- 网络处理器——下一代网络发展的核心技术被引量:8
- 2003年
- 阐述了网络处理器的概念及其产生的技术背景 ,并给出了网络处理器的基本结构 ,同时指出其优点。
- 范荣真沈凤池杨东勇陈雪江
- 关键词:网络处理器下一代网络ASICVLIWRISC
- 多智能体协作的两层强化学习实现方法被引量:5
- 2005年
- 提出了多智能体协作的两层强化学习方法。该方法主要通过在单个智能体中构筑两层强化学习单元来实现,将该方法应用于3个智能体协作抬起圆形物体的计算机模拟中,结果表明比采用传统强化学习方法的智能体协作得更好。
- 陈雪江杨东勇范荣真
- 关键词:多智能体计算机模拟
- 最新网络三层分组交换技术及其应用
- 2003年
- 分析了局域网中网段划分所带来的网段中子网路由必须依赖传统路由器所造成的网络”瓶颈”问题 ,详细介绍了网络三层分组交换技术的基本原理和拓扑结构 ,给出了其软硬件实现的原理图 ,并指出了它的特点。最后 。
- 陈雪江杨东勇
- 关键词:ASIC芯片MAC地址VLANQOS组播
- 基于强化学习的多机器人协作机制研究
- 基于马尔科夫过程的强化学习作为一种在线学习方式,能够很好地应用于单智能体环境中.由于强化学习理论的限制,在多智能体系统中马尔科夫过程模型不再适用,因此不能把强化学习直接用于多智能体的协作学习问题.该文提出了多智能体协作的...
- 陈雪江
- 关键词:多智能体
- 文献传递