王奇
- 作品数:2 被引量:2H指数:1
- 供职机构:贵州大学计算机科学与技术学院更多>>
- 发文基金:贵州省高等学校教学质量与教学改革工程项目国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于动作空间划分的MAXQ自动分层方法
- 2017年
- 针对分层强化学习需要人工给出层次结构这一问题,同时考虑到基于状态空间的自动分层方法在环境状态中没有明显子目标时分层效果并不理想的情况,提出一种基于动作空间的自动构造层次结构方法。首先,根据动作影响的状态分量将动作集合划分为多个不相交的子集;然后,分析Agent在不同状态下的可用动作,并识别瓶颈动作;最后,由瓶颈动作与执行次序确定动作子集之间的上下层关系,并构造层次结构。此外,对MAXQ方法中子任务的终止条件进行修改,使所提算法构造的层次结构可以通过MAXQ方法找到最优策略。实验结果表明,所提算法可以自动构造层次结构,而不会受环境变化的干扰。与Q学习、Sarsa算法相比,MAXQ方法根据该结构得到最优策略的时间更短,获得回报更高。验证了所提算法能够有效地自动构造MAXQ层次结构,并使寻找最优策略更加高效。
- 王奇秦进
- 关键词:分层强化学习马尔可夫决策过程
- 高等教育信息化建设中教育资源的有效应用研究被引量:2
- 2015年
- 介绍了当前我国高等教育信息化发展的现状,分析了贵州省高等教育信息化建设中的资源建设,提出要有效应用教育资源,避免重复建设,提高资源利用率。
- 王奇秦进
- 关键词:教育信息化资源建设教育资源