您的位置: 专家智库 > >

卢宇鹏

作品数:4 被引量:1H指数:1
供职机构:浙江大学更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇专利
  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...
  • 2篇文化科学

主题

  • 3篇玩家
  • 3篇非玩家角色
  • 3篇Q学习
  • 2篇血量
  • 2篇隐含层
  • 2篇陪练
  • 2篇权系数
  • 1篇网络
  • 1篇机器人

机构

  • 4篇浙江大学

作者

  • 4篇卢宇鹏
  • 2篇刘勇
  • 2篇卢建刚
  • 1篇刘勇

传媒

  • 1篇科技导报

年份

  • 1篇2020
  • 2篇2018
  • 1篇2017
4 条 记 录,以下是 1-4
排序方式:
一种基于深度Q学习网络的非玩家角色战斗策略学习方法
本发明公开了一种基于深度Q学习网络的非玩家角色战斗策略学习方法,利用学习型非玩家角色的位置、技能冷却时间、控制状态以及陪练型角色的位置、技能冷却时间、控制状态作为输入状态,以学习型非玩家角色的所有技能作为输出动作集合,采...
卢建刚卢宇鹏刘勇
局部随机行为机器人可促进人类整体协作
2017年
遵循原则办事一直以来被认为是人类高效合作的基础,然而最近一项研究表明,一定程度上不按常理出牌反而可以促进人类合作,实现大同。2017年5月17日,来自耶鲁大学的学者Hirokazu Shirado和Nicholas A.Christakis,
刘勇卢宇鹏
关键词:机器人
基于深度强化学习的非玩家角色智能增强研究
人工智能是当前非常火热的研究领域,国家也将人工智能教育列入规划中,其中感知和决策是人工智能中非常重要的环节。得益于深度学习的迅速发展,深度强化学习(DRL)逐渐成为了该环节中关键的方法。深度强化学习通过深度神经网络感知高...
卢宇鹏
关键词:非玩家角色
文献传递
一种基于深度Q学习网络的非玩家角色战斗策略学习方法
本发明公开了一种基于深度Q学习网络的非玩家角色战斗策略学习方法,利用学习型非玩家角色的位置、技能冷却时间、控制状态以及陪练型角色的位置、技能冷却时间、控制状态作为输入状态,以学习型非玩家角色的所有技能作为输出动作集合,采...
卢建刚卢宇鹏刘勇
文献传递
共1页<1>
聚类工具0