江苏省自然科学基金(BK2009116)
- 作品数:13 被引量:34H指数:3
- 相关作者:刘纯平刘全龚声蓉王朝晖朱文文更多>>
- 相关机构:苏州大学吉林大学南京大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金苏州市科技计划项目(应用基础研究计划)更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Tile Coding编码和模型学习的Actor-Critic算法被引量:3
- 2014年
- Actor-Critic是一类具有较好性能及收敛保证的强化学习方法,然而,Agent在学习和改进策略的过程中并没有对环境的动态性进行学习,导致Actor-Critic方法的性能受到一定限制。此外,Actor-Critic方法中需要近似地表示策略以及值函数,其中状态和动作的编码方法以及参数对Actor-Critic方法有重要的影响。Tile Coding编码具有简单易用、计算时间复杂度较低等优点,因此,将Tile Coding编码与基于模型的Actor-Critic方法结合,并将所得算法应用于强化学习仿真实验。实验结果表明,所得算法具有较好的性能。
- 金玉净朱文文伏玉琛刘全
- 关键词:TILECODING函数逼近
- 一种使用校正模板的非线性摄像机标定方法被引量:8
- 2011年
- 基于图像点满足的特定直线方程以及相邻图像点之间距离相等的性质,对标定模板图像进行校正,并通过改进的张正友标定法,提出了一种新的使用校正模板的非线性摄像机标定方法。与现存的方法进行比较发现,该方法能够实现较高精度的摄像机标定,鲁棒性比较强,且能够大大地降低算法的复杂度。
- 郑俊龚声蓉刘纯平
- 关键词:摄像机标定镜头畸变鲁棒性
- 基于伸展树的无线传感器网络事件区域检测被引量:1
- 2010年
- 本文提出一种基于伸展树的事件区域容错检测算法,该算法在构成的分布式融合树上实施,由多元回归方程对事件发生的可能性进行评估,利用被检测事件的时空相关性,使得在缺少传感节点的区域,Sink节点也可以获得事件发生的状态信息.理论分析及仿真结果表明,即使节点发生故障的概率较高,提出的检测算法也能获得较高的精度和较小的误判率,表明在事件区域容错检测中应用该方法是可行的.
- 张书奎崔志明樊建席张文哲
- 关键词:无线传感器网络
- 像素域Wyner-Ziv视频编码系统性能优化方法
- 2013年
- 以分布式视频编码理论为基础,对Wyner-Ziv编码方案开展了深入研究。在对典型的边信息生成方法进行分析与比较的基础上,提出了一种改进的多路径边信息生成策略,并提出用错误隐藏技术来对传输出错的关键帧进行处理。实验结果表明,多路径边信息生成策略与运动补偿外推法相比可以生成质量更好的边信息;使用错误隐藏技术可以保证关键帧的传输质量,提高系统的鲁棒性;对错误恢复过的解码帧用多路径边信息生成策略进行边信息生成,使边信息精确度进一步得以提高,实现了对Wyner-Ziv系统进行优化的目的。
- 栾仕喜冷飞徐进华
- 关键词:分布式视频编码错误隐藏技术
- 基于相变和似然性的多相图像分割方法被引量:2
- 2012年
- Sine-Sinc模型是一种基于材料科学中Modica-Mortola物理相变原理的多相图像分割方法.针对该模型分割结果不完全、易受噪声和亮度不均匀性影响的问题,提出了一个改进的Sine-Exp-Gauss多相图像分割模型.基于Sine-Sinc模型,Sine-Exp-Gauss模型用指数函数代替Sine-Sinc模型的Sinc函数,并从分段常数图像假设推广到高斯分布函数图像假设;模型偏微分方程的数值解采用凸函数分裂方法迭代,获得每个相的局部最优解,同时给出一种标准初始化方法使迭代过程易于收敛到理想局部极小值.与Sine-Sinc模型和偏差矫正模型相比,实验结果证明Sine-Exp-Gauss模型在噪声消除和自偏差矫正方面都更加鲁棒.
- 刘纯平CHENFu-HHa龚声蓉崔志明刘全
- 关键词:多相图像分割
- 基于人体图模型和背景减除的姿势估计被引量:2
- 2012年
- 自然场景或电视剧中的人物,其姿势、背景、轮廓、大小总是不断发生变化,人体姿势估计是计算机视觉中具有挑战性的课题之一。针对静态图像中的人体姿态估计容易受背景的影响而又没有合适的背景提取方法,先大致确定人体范围,将调整的检测框的大小作为grabcut的输入,利用grabcut的分割结果确定出人所在的前景,进一步利用图像的边缘信息和区域信息推断出人体的姿势,最后通过实验证明了该方法的有效性。
- 费兰英范宁宁
- 关键词:图像分割
- Ad Hoc网络中的视频传输方法与技术综述
- 2012年
- Ad Hoc网络由于拓扑变化以及节点的移动导致路径经常性中断,使得Ad Hoc网络信道误码率和传输丢包率高,这给视频传输带来了新的挑战。因此,研究适合Ad Hoc网络的视频编码和传输方法成为了当今一大热点。在结合Ad Hoc网络传输特性的基础上,从视频编码、传输和接收端同时入手,对目前Ad Hoc网络视频传输的研究现状和主要方法进行了系统的论述,并对适合Ad Hoc网络传输视频的新机制及其关键技术进行了展望。
- 王朝晖
- 关键词:ADHOC视频编码视频传输
- 连续空间的递归最小二乘行动者—评论家算法被引量:2
- 2014年
- 传统的行动者—评论家(actor-critic,AC)算法用在连续空间时,数据利用率低、收敛慢,而现实世界中采样往往需要昂贵的代价,因此提出了一种新的连续空间递归最小二乘AC算法,能够充分利用数据,提高学习预测能力。该方法用高斯径向基函数对连续的状态空间进行编码,评论家部分改用带资格迹的递归最小二乘时间差分方法,而行动者部分用策略梯度方法,在连续动作空间中进行策略搜索。Mountain Car问题的仿真结果表明该算法具有较好的收敛结果。
- 朱文文金玉净伏玉琛宋绪文
- 关键词:递归最小二乘
- 局部时空域模型的核密度估计目标检测方法被引量:2
- 2012年
- 针对非参数核密度估计在前期学习阶段信息冗余和计算量大,在后期背景更新阶段自适应性差需手动调整阈值和检测结果出现阴影等问题,提出一种基于局部时空域模型的核密度估计目标检测方法。在前期训练学习阶段采用K均值聚类选择关键帧,从而避免信息冗余和计算量大问题;在后期背景更新阶段,构建一种局部时空域模型,在时间域通过历史帧信息自适应调整时间域窗口大小,在空间域利用颜色和LBP描述的纹理特征消除部分阴影问题。在复杂场景下的实验结果表明,该算法在实时性和检测准确率方面有效得到提高。
- 王兴宝刘纯平费兰英王朝晖季怡
- 关键词:核密度估计K均值LBP算子
- 一种改进的平均奖赏强化学习方法在RoboCup训练中的应用被引量:2
- 2012年
- 强化学习在人工智能领域中是一种重要的解决学习控制问题的方法.在强化学习中,平均奖赏类型的强化学习方法适用于解决具有循环特性或者不具有终结状态的问题,然而平均奖赏强化学习存在收敛速度慢、对参数和环境敏感等问题.针对平均奖赏强化学习收敛速度缓慢这一问题,提出了一种改进的平均奖赏强化学习方法.同时,为了处理大状态空间、提高泛化能力,算法采用神经网络作为近似函数.算法在RoboCup中实验的训练表明该算法具有较快的收敛速度和较强的泛化能力.
- 李瑾刘全杨旭东杨凯翁东良
- 关键词:平均奖赏ROBOCUP