孔庆群 作品数:14 被引量:8 H指数:2 供职机构: 中国科学院自动化研究所 更多>> 发文基金: 国家自然科学基金 北京市自然科学基金 中国科学院战略性先导科技专项 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
类脑多模态融合方法及装置 本发明涉及人工智能技术领域,具体提供了一种类脑多模态融合方法及装置,旨在解决如何提高多模态融合方法识别准确性的技术问题。为此目的,本发明中的类脑多模态融合方法包括下述步骤:依据图像信息获取目标物体所属预设第一类别的置信度... 孔庆群 张铁林 鲁恩萌 曾毅基于深度学习的图像匹配:方法、应用与挑战 被引量:1 2024年 图像匹配旨在建立图像之间的点对应关系,是许多计算机视觉任务的关键环节.近年来,随着深度学习技术的发展,图像匹配方法已从以手工设计特征为主转变为基于深度网络的方法,基于深度学习的图像匹配方法在多个标准数据集上展现出卓越的性能,推动着多个相关应用的发展围绕图像匹配涉及的若干关键问题,如:特征点检测、特征点描述、稠密点匹配、误匹配去除,本文对深度学习图像匹配方法进行了系统性总结.首先分析了领域内基于深度学习的典型方法和关键技术,随后介绍了与图像匹配密切相关的几个典型应用并给出其现状分析,最后,根据对图像匹配领域技术发展的分析总结,结合作者在该领域的长期研究积累,本文给出了目前图像匹配所面临的主要挑战以及未来发展趋势。 孔庆群 吴福朝 吴福朝关键词:图像匹配 特征点匹配 三维重建 视觉定位 同时定位与建图 运动检测方法及躲避和跟踪运动目标的方法 本发明涉及了运动检测方法及跟踪运动目标的方法。其中运动检测方法包括:获取图像序列;确定图像序列中运动目标在三维时空空间中不同三维时空方向对应的运动响应;对运动目标在所述三维时空空间中不同三维时空方向对应的运动响应进行投影... 白俊 曾毅 赵菲菲 孔庆群文献传递 基于脉冲神经网络模型增量学习的分类方法、系统、装置 本发明属于类脑智能、人工智能领域,具体涉及一种基于脉冲神经网络模型增量学习的分类方法、系统、装置,旨在解决现有增量学习方法无法自适应的学习新类别进行分类的问题。本系统方法包括获取待分类的样本数据集;通过脉冲神经网络模型获... 孔庆群 曾毅 赵东城文献传递 加权视差能量模型 被引量:1 2014年 由于人左右眼间距的存在,使得同一空间物体在左右眼视网膜上的投影存在位置差异,称之为视差.左右眼视网膜获取的信息最初在初级视皮层(V1区)进行融合,该区域有大量对视差敏感的神经元.关于它们的视差选择特性,目前比较公认的计算模型是视差能量模型,然而该模型却无法解释V1区神经元对反相关随机点立体图(Anti-correlated random dot stereograms,aRDS)的响应要比对随机点立体图的响应弱这一神经生理学发现.为此,本文提出了一种加权视差能量模型:首先,利用左右眼感受野内的信号差异对神经元的响应能量进行调制,然后再结合神经元之间的相互作用来计算细胞群响应,从而得到图像视差.本文旨在探索基于神经生理学的视差计算方法,主要贡献有:1)加权视差能量模型能够很好地解释V1区神经元对反随机点立体图的响应比随机点立体图响应弱的生理特性;2)加权视差能量模型的视差计算结果精度比现有基于神经生理学的模型更高,甚至高于一些传统的计算机视觉方法. 孔庆群 王波 胡占义关键词:双目视差 灰度差 视皮层中的视差计算 被引量:2 2011年 对应问题是从图像恢复物体三维几何形状的核心问题,也是计算机视觉领域长久以来没有很好解决的问题.尽管文献中有大量对应点匹配算法报道,但这些主体基于数学和工程的方法,在鲁棒性方面离人类视觉还有很大的差距.所以,建立基于生理机理的立体感知模型,可望有效提高匹配的鲁棒性.然而,要建立这种基于生理机制的计算模型,需要对生物立体感知的机理有所了解.基于此,本文对近年来关于生物立体感知的进展和主要研究成果进行了总结,包括初级区域V1,V2,V3区,以及背部通道的MT,MST,IPS和腹部通道的V4,IT区.除了对这些区域关于神经生理的成果进行介绍外,我们还简单介绍了著名的视差能量模型及其推广模型.本文对研究计算机视觉的人员有一定的参考价值. 孔庆群 明雁声 胡占义运动检测方法及躲避和跟踪运动目标的方法 本发明涉及了运动检测方法及跟踪运动目标的方法。其中运动检测方法包括:获取图像序列;确定图像序列中运动目标在三维时空空间中不同三维时空方向对应的运动响应;对运动目标在所述三维时空空间中不同三维时空方向对应的运动响应进行投影... 白俊 曾毅 赵菲菲 孔庆群文献传递 基于皮层丘脑计算模型的图像分类方法 本发明涉及类脑智能和人工智能领域,具体涉及一种基于皮层丘脑计算模型的图像分类方法。旨在解决传统人工神经网络中浪费训练数据和训练神经网络过程中所需计算量较大的问题。本发明基于轮廓先验神经网络N<Sub>1</Sub>、融合... 赵东城 曾毅 孔庆群文献传递 基于视觉恐惧反应脑机制的应急避障方法 本发明涉及一种基于视觉恐惧反应脑机制的应急避障方法。其中,该方法包括获取图像序列;基于视网膜信息处理机制,检测图像序列中障碍物的运动方向和运动速度;基于障碍物的运动方向和运动速度,根据PV<Sup>+</Sup>神经元信... 赵菲菲 孔庆群 曾毅 白俊文献传递 三维点云语义分割:现状与挑战 被引量:3 2023年 随着获取点云数据成本下降以及GPU算力的提高,众多三维视觉场景如自动驾驶、工业控制、MR/XR对三维语义分割的需求日益旺盛,这进一步推动了深度学习模型在三维点云语义分割任务中的发展.近期,深度学习模型在网络架构上持续创新,如RandLA-Net和Point Transformer,并突破性地以更低的计算成本提高了分割准确率,但已有的三维点云语义分割综述介绍的研究工作包含大量早期以及被舍弃的方法,没有系统地整理这些新型高效的方法,不能很好地体现研究现状.此外,这部分综述以输入网络的不同数据类型分类各点云语义分割方法,不能有效地体现各方法的演进关系,也不利于对比不同方法的分割性能.针对以上问题,本文面向近3年的研究成果和最新的研究进展,重点归纳了三维点云语义分割中基于不同网络架构的方法、面临的挑战及潜在研究方向,并从3个层面对三维点云语义分割进行了系统地综述.通过本文,读者可以较系统地了解三维点云语义分割的数据获取方式、常见数据集及模型的评价指标,对比基于不同网络架构的三维点云语义分割方法的发展过程、分割性能和优缺点,并进一步认识三维点云语义分割现存的挑战和潜在的研究方向. 王艺娴 胡雨凡 孔庆群 曾慧 曾慧 张利欣关键词:三维视觉 点云 网络架构