季怡
- 作品数:51 被引量:102H指数:6
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金江苏高校优势学科建设工程资助项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种基于特征学习的跨年龄人脸验证方法
- 本发明公开了一种基于特征学习的跨年龄人脸验证方法,包括如下步骤:(1)获取待对比的两幅人脸图像;(2)利用人脸特征点定位的方法对两幅人脸图像进行对齐操作;(3)分别对每幅图像进行特征提取,方法为:①通过深度卷积神经网络自...
- 王朝晖翟欢欢刘纯平季怡龚声蓉葛瑞
- 基于深度残差双单向DLSTM的时空一致视频事件识别被引量:13
- 2018年
- 监控视频下的事件识别是近期计算机视觉领域的研究热点之一.然而,自然场景下监控视频往往具有背景复杂、事件区域内对象遮挡严重等特点,使得事件类内差异大、类间差异小,给识别带来了很大的困难.为解决复杂背景下事件识别问题,提出了一种基于深度残差双单向DLSTM(DRDU-DLSTM)的时空一致视频事件识别方法.该方法首先从训练好的时间CNN网络和空间CNN网络获取视频的时空深度特征,经LSTM同步解析后形成时空特征数据联接单元DLSTM,并作为残差网络的输入.双单向传递的DLSTM联接后构成DU-DLSTM层;多个DU-DLSTM层再加一个恒等映射形成残差模块;在此基础上,多层的残差模块堆叠构成了深度残差网络架构.为了进一步优化识别结果,设计了基于双中心Loss的2C-softmax目标函数,在最大化类间距离的同时最小化类内间隔距离.在监控视频数据集VIRAT 1.0和VIRAT 2.0上的实验表明,该文提出的事件识别方法有很好的性能表现和稳定性,识别准确率分别提高了5.1%和7.3%.
- 李永刚李永刚王朝晖董虎胜董虎胜龚声蓉季怡刘纯平
- 关键词:监控视频
- 基于超像素的Codebook动态场景中目标检测方法
- 本发明公开了一种基于超像素的Codebook动态场景中目标检测方法,其特征在于,包括以下步骤:(1)采用的超像素分割方法对视频帧进行分割,分割成K个超像素;(2)采用Codebook背景建模法,为步骤(1)中分割出来的每...
- 刘纯平方旭陈宁强龚声蓉季怡
- 文献传递
- 一种图像风格迁移方法及系统
- 本发明公开了一种图像风格迁移方法及系统,包括:S1、将内容图像和风格图像分别输入两个编码器,并分别得到内容特征和风格特征;S2、将得到的内容特征和风格特征分别输入两个SPNet金字塔网络进行语义增强,并分别得到增强后的内...
- 刘纯平石涤波陈哲恺季怡李蓥
- 基于指称理解的视频安防检测方法
- 本发明公开了一种基于指称理解的视频安防检测方法,其特征在于,包括以下步骤:获取待处理的视频中的图像帧数据及待检测目标的指称数据;由语言注意力模块、基于协同注意力的主语模块、位置模块和基于视觉上下文的关系模块4个部分构成指...
- 刘纯平高友明陈宁强徐云龙季怡
- 文献传递
- 一种用于视频的基于双向长短时记忆单元的行为识别方法
- 本发明公开了一种用于视频的基于双向长短时记忆单元的行为识别方法,包括:(1)输入视频序列,提取视频序列中的RBG帧序列和光流图像;(2)分别训练RGB图像深度卷积网络和光流图像深度卷积网络;(3)提取网络的多层特征,其中...
- 刘纯平葛瑞季怡刘海宾龚声蓉
- 文献传递
- 基于非清晰区域抑制的多特征融合显著区域提取方法
- 本发明公开了一种基于非清晰区域抑制的多特征融合显著区域提取方法,首先输入待处理的源图像,再进行如下处理:(1)预处理;(2)对经过预处理的图像进行低层特征提取,获得空间显著图和频域显著图;(3)对经过预处理的图像进行高层...
- 刘纯平郑阳陈宁强季怡王朝晖陈宇
- 文献传递
- 基于单-多视图优化的足球球员三维姿态和体型估计
- 2024年
- 足球比赛场景的三维重建有助于观众自由切换视角,增加了互动性和沉浸感。针对足球比赛场景中的足球球员,提出一种三维姿态和体型估计方法。对球员的多视图图像使用训练好的部分注意力回归的三维人体估计(PARE)模型生成初始的三维姿态和体型估计,并使用人工标注的二维关节点作为优化目标。单-多视图优化操作利用蒙皮多人线性模型(SMPL)和正交投影的可微性,将球员的三维姿态和体型参数映射到二维关节点,计算其与人工标注之间的差异,再使用神经网络的反向传播算法更新三维姿态和体型参数,持续这些过程直到差异最小化。在自建的足球球员多视图数据集上的实验结果表明,该方法能够有效估计足球球员的三维姿态和体型,与人体网格恢复、在循环中优化SMPL、PARE等方法相比,二维关节点精度在单视图上提高了9.2%~37.5%,在多视图交叉验证中提高了34.9%~54.1%。
- 谢欢刘纯平季怡
- 用于脱机手写汉字识别的汉字字符切分方法
- 本发明公开了一种用于脱机手写汉字识别的汉字字符切分方法,其特征在于,包括下列步骤:(1)对待识别的汉字图像进行预处理,所述预处理包括对图像进行二值化处理;(2)基于投影分析对汉字图像进行粗分割,将非粘连的字符分割成单个字...
- 刘纯平周双飞王朝晖季怡龚声蓉蒋德茂
- 基于增强特征金字塔网络的场景文本检测算法被引量:10
- 2022年
- 场景文本检测有助于机器理解图像内容,在智能交通、场景理解和智能导航等领域应用广泛。现有的场景文本检测算法未充分利用高层语义信息和空间信息,限制了模型对复杂背景像素的分类能力和对不同尺度的文本实例的检测和定位能力。为解决上述问题,提出了一种基于增强特征金字塔网络的场景文本检测算法。该算法包括比率不变特征增强(Ratio Invariant Feature Enhanced,RIFE)模块和重建空间分辨率(Rebuild Spatial Resolution,RSR)模块。RIFE模块作为残差分支,增强了网络的高层语义信息传递,提高了分类能力,降低了误报率和漏捡率。RSR模块重建多层特征分辨率,利用丰富的空间信息改进边界位置。实验结果表明,所提算法提升了在多方向文本数据集ICDAR2015、弯曲文本数据集Totaltext以及长文本数据集MSRA-TD500上的检测能力。
- 邵海琳季怡刘纯平徐云龙
- 关键词:语义信息空间信息