吴沧浦
- 作品数:94 被引量:315H指数:7
- 供职机构:北京理工大学更多>>
- 发文基金:国家自然科学基金国防科技技术预先研究基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术理学社会学经济管理更多>>
- 大规模系统的分散模型参考自适应控制
- 在本文中,分散模型参考自适应控制(DMRAC)算法在非线性大规模系统控制中显示出明显的效果.新的自适应算法的稳定性和鲁棒性被研究.特别地,除了系统状态的维数信息外,大系统的模型参数和控制器增益可自适应的计算,并可证明具有...
- 解三明吴沧浦赵纯钧
- 关键词:分散控制稳定性鲁棒性
- 文献传递
- 热轧流水线节奏控制的研究与数字模拟
- 机服务系统理论的观点研究热轧流水线生产节奏问题。通过对现场操作和生产调度情况的了解及对实际生产数据的统计分析,确定了该系统的服务原则及服务时间,并且推导了出现拥挤现象的概率,通过数字模拟,研究了轧制节奏及调整时间对产品产...
- 张迪生吴沧浦
- 关键词:时间序列分析数学模型控制系统统计分析(数学)热轧
- 一种集成规划的SARSA(λ)强化学习算法被引量:4
- 2002年
- 提出一种新的集成规划的 SARSA(λ)强化学习算法 .该算法的主要思想是充分利用已有的经验数据 ,在无模型学习的同时估计系统模型 ,每进行一次无模型学习的试验后 ,利用模型在所记忆的状态 /行动对组成的表中进行规划 ,同时利用该表给出了在学习和规划之间的量化折中参考 .实验结果表明 ,本算法比单纯的无模型学习SARSA(λ)
- 李春贵吴沧浦刘永信
- 关键词:MARKOV决策过程
- 平板玻璃窑炉成型部双级温度微机控制系统
- 刘鸿京吴沧浦
- 关键词:玻璃熔窑平板玻璃
- 一类非线性连续大系统的三层递阶最优控制算法被引量:1
- 1997年
- 关于非线性连续大系统的最优控制问题,应用线性化和预估方法[1],非线性问题可转化为一系列线性子系统问题,利用共态预估方法,从而在低层并行地求解低维子系统的最优化问题,而上两层分别连续地逼近所指定预估变量及共态向量和拉格朗日乘子,直到达到各自的最优值,最后得到全局问题解的三层递阶最优控制算法.其主要优点是明显地减少了计算时间.
- 解三名赵纯均吴沧浦
- 关键词:最优控制非线性
- 离散时滞大系统的最优跟踪递阶控制方法被引量:6
- 1996年
- 考虑具有控制时滞及输入输出之间前向通道的大系统,应用线性二次型加积分(LQI)[1]的最优状态反馈控制理论和带时滞增广状态向量方法,转化原大系统为满足马尔可夫性质的增广状态大系统,再作子问题分解后[2],整个大系统的解可由子问题层的局部控制器和上层协调器迭代计算。
- 解三明吴沧浦赵纯钧
- 关键词:时滞系统递阶控制
- 一种估计慢时变参数的新型快速辨识算法
- 本文介绍了加权最小二乘算法(WRLS)和加权修改最小二乘算法(WMRLS),给出了协方差阵P(k)的简单求法,使得计算量大为减少,但仍保持了原算法的优良品质。
- 李红新吴沧浦
- 关键词:准则函数加权
- 文献传递
- Q学习算法在库存控制中的应用被引量:29
- 1999年
- Q学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.这里提出了一种新的探索策略,并将该策略和Q学习算法有效结合来求解一类典型的有连续状态和决策空间的库存控制问题.仿真表明,该方法所求解的控制策略和用值迭代法在模型已知的情况下所求得的最优策略非常逼近,从而证实了Q学习算法在一些系统模型未知的工程控制问题中的应用潜力.
- 蒋国飞吴沧浦
- 关键词:运筹学Q学习算法
- 智能系统与机器学习的新领域
- <正>1987年美国著名神经控制系统专家Werbos,P.J.在论文《建立与理解自适应系统:工厂自动化与人脑研究的统计/数值方法》提出将动态规划与神经网络结合以形成一种具有人脑学习功能的机器学习、智能系统以及神经控制的新...
- 吴沧浦
- 文献传递
- 多指标动态规划的交互式满意置换率法
- 1994年
- 提出了一种新的求解多指标动态规划问题的算法.它是由多目标静态规划的交互式满意置换率法[1]推广得到的.通过增加附加状态变量进行数学模型转换,将单指标动态规划问题转化为静态规划问题,再进行迭代.这样既减少了计算量,又使各指标间的置换关系易于求得.所提方法在人机交互过程中对决策者的要求不高,对于一类常见的多指标动态规划问题,可以迅速获得满意的解.
- 赵蔚吴沧浦
- 关键词:多目标规划动态规划置换率