王本年
- 作品数:20 被引量:162H指数:9
- 供职机构:铜陵学院更多>>
- 发文基金:安徽省高校省级自然科学研究项目国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学农业科学矿业工程更多>>
- 面向Option的k-聚类Subgoal发现算法被引量:12
- 2006年
- 在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现所有符合要求的Subgoal,与Q-学习和基于多样性密度的强化学习算法相比,用该算法发现Subgoal并创建Option的强化学习算法能有效提高A-gent的学习速度.
- 王本年高阳陈兆乾谢俊元陈世福
- 关键词:分层强化学习OPTION子目标
- 一种域分布式合作Web缓存系统被引量:6
- 2002年
- 在分析 Internet缓存协议 (ICP)和基于集中管理的协作式 Web缓存系统 (CMCS)的基础上 ,提出了一种域分布式合作 Web缓存系统模型 (DDCCS) .该模型克服了 ICP的缓存内容冗余问题和 CMCS集中管理的不健壮问题 ,并能充分考虑各代理缓存器的处理能力和缓存能力 ,采用区间离散化方法和加权区间片分配算法 ,使得各代理的负担更加均匀合理 ,在性能上较 ICP和
- 王本年曹先彬
- 关键词:代理服务器INTERNET
- 贝叶斯学习与强化学习结合技术的研究被引量:3
- 2006年
- 强化学习的研究需要解决的重要难点之一是:探索未知的动作和采用已知的最优动作之间的平衡。贝叶斯学习是一种基于已知的概率分布和观察到的数据进行推理,做出最优决策的概率手段。因此,把强化学习和贝叶斯学习相结合,使 Agent 可以根据已有的经验和新学到的知识来选择采用何种策略:探索未知的动作还是采用已知的最优动作。本文分别介绍了单 Agent 贝叶斯强化学习方法和多 Agent 贝叶斯强化学习方法:单 Agent 贝叶斯强化学习包括贝叶斯 Q 学习、贝叶斯模型学习以及贝叶斯动态规划等;多 Agent 贝叶斯强化学习包括贝叶斯模仿模型、贝叶斯协同方法以及在不确定下联合形成的贝叶斯学习等。最后,提出了贝叶斯在强化学习中进一步需要解决的问题。
- 陈飞王本年高阳陈兆乾陈世福
- 关键词:贝叶斯学习多AGENT
- 基于FNN与GA相融合的数据挖掘方法研究被引量:4
- 2008年
- 模糊神经网络即具有输入信号是模糊量的神经网络,是模糊系统与神经网络相结合的产物,汇聚了二者的优点;遗传算法是一种自适应全局优化概率搜索算法。研究了基于模糊神经网络与遗传算法相融合的一种算法,在应用模糊神经网络进行数据挖掘前,应用遗传算法完成隶属函数的训练,以便更好地进行模糊神经网络学习;经过模糊神经网络学习后,提取相关规则,再次应用遗传算法,进行规则剪枝,提高数据挖掘效率。实验表明,与传统方法相比,该方法能够更快速、更加准确地进行数据挖掘,提取更精确的推理规则。
- 王刚王本年
- 关键词:数据挖掘模糊神经网络隶属函数规则剪枝
- RLGA:一种基于强化学习机制的遗传算法被引量:10
- 2006年
- 分析了强化学习与遗传算法工作机制,在提出基因空间分割概念的基础上,提出了一种将强化学习与遗传算法内在结合起来的算法RLGA,在遗传算法的框架下实现强化学习机制.从理论上分析了RLGA的收敛性,讨论了RLGA的时间和空间效率及其与基因空间分割的关系,通过实验分析了RLGA中基因空间分割的指导范围.实验结果表明,RLGA具有良好的全局收敛性能.
- 王本年高阳陈兆乾谢俊元陈世福
- 关键词:遗传算法收敛性
- 分层强化学习几个关键技术研究
- 强化学习是一种从与环境交互中学习的机器学习技术,是目前机器学习研究中最活跃的方向之一。强化学习所面临的一个突出问题是大空间和复杂非线性任务带来的“维度灾难”问题。分层强化学习通过时间抽象形成分层控制来简化问题的处理,从而...
- 王本年
- 关键词:分层强化学习背景知识强化学习算法
- 关联规则挖掘在在线考试系统中的应用被引量:2
- 2007年
- 文章针对在线考试系统决策性等问题进行了研究,将试题概化到知识点层面进行关联规则抽取。实际应用显示,应用改进后的关联规则挖掘增强了在线考试系统决策性、个性化、通用性,取得了良好的效果。
- 陈文李龙澍王本年
- 关键词:关联规则在线考试系统概化FP-GROWTH算法
- 基于模拟退火遗传算法的贝叶斯分类被引量:9
- 2007年
- 朴素贝叶斯分类器是一种简单而高效的分类器,但是其属性独立性假设限制了对实际数据的应用。文章提出一种新的算法,该算法为避免数据预处理时的属性约简对分类效果的直接影响,在训练集上通过随机属性选取生成若干属性子集,以这些子集构建相应的朴素贝叶斯分类器,采用模拟退火遗传算法进行优选。实验表明,与传统的朴素贝叶斯方法相比,该方法具有更好的性能。
- 胡为成程转流王本年
- 关键词:朴素贝叶斯模拟退火算法遗传算法属性约简适应度函数
- 基于DSCFCI_tree的带项目约束的数据流频繁闭合模式挖掘算法被引量:2
- 2009年
- 根据数据流的特点,提出了一种挖掘约束频繁闭合项集的算法,该算法将数据流分段,用DSCFCI_tree动态存储潜在约束频繁闭合项集,对每一批到来的数据流,首先建立局部DSCFCI_tree,进而对全局DSCFCI_tree进行有效更新并剪枝,从而有效地挖掘整个数据流中的约束频繁闭合模式.实验表明,该算法具有很好的时间和空间效率.
- 胡为成王本年程转流
- 关键词:数据挖掘数据流关联规则
- 基于模拟退火算法的遗传程序设计方法被引量:12
- 2006年
- 遗传程序设计(GP)是运用遗传算法的思想,通过生成计算机程序来解决问题的,但用它来解决大型或复杂问题时,就存在一些难以解决的问题,尤其是大量使用计算机内存和CPU时间,大大影响了工作性能。以符号回归问题为例,针对传统的遗传程序设计方法在解决问题时所遇到的困难,提出一个基于模拟退火算法的遗传程序设计方法,进一步提高GP系统求解问题的能力。
- 胡为成王本年程转流
- 关键词:遗传程序设计模拟退火算法参数估计适应度