孙晓帅 作品数:18 被引量:49 H指数:3 供职机构: 哈尔滨工业大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 更多>>
深度学习中的自编码器的表达能力研究 被引量:35 2015年 近年来,深度学习框架和非监督学习方法越来越流行,吸引了很多机器学习和人工智能领域研究者的兴趣。从深度学习中的"构造模块"入手,主要研究自编码器的表达能力,尤其是自编码器在数据降维方面的能力及其表达能力的稳定性。从深度学习的基础方法入手,旨在更好地理解深度学习。第一,自编码器和限制玻尔兹曼机是深度学习方法中的两种"构造模块",它们都可用作表达转换的途径,也可看作相对较新的非线性降维方法。第二,重点探究了对于视觉特征的理解,自编码器是否是一个好的表达转换途径。主要评估了单层自编码器的表达能力,并与传统方法PCA进行比较。基于原始像素和局部描述子的实验验证了自编码器的降维作用、自编码器表达能力的稳定性以及提出的基于自编码器的转换策略的有效性。最后,讨论了下一步的研究方向。 王雅思 姚鸿勋 孙晓帅 许鹏飞 赵思成关键词:数据降维 自然场景图像文字检测方法 自然场景图像文字检测方法,它涉及一种通过采用纹理描述子LHBP来描述图像纹理特征并采用多尺度向性滤波的方法进行图像中的文字检测的方法,以解决基于纹理的文字检测方法存在的对光照的要求较复杂、文字与背景对比度变化对检测影响较... 姚鸿勋 许鹏飞 纪荣嵘 孙晓帅 刘天强 刘先明文献传递 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法,属于视频分析与理解领域。目的是解决视频浏览检索准确率和查全率不高的问题。本发明主要创新点在于:利用了视频镜头内部各个场景之间的物理关联线索,即不同表观的场景在... 姚鸿勋 纪荣嵘 孙晓帅 许鹏飞 刘天强 刘先明文献传递 基于LHBP多尺度向性滤波的文字检测算法 被引量:3 2010年 复杂光照条件和文字—背景的交融是自然场景图像中文字检测的主要难点。为解决该问题,提出了基于LHBP(local Haar binary pattern)多尺度向性滤波的文字检测算法。该算法首先采用对光强变化不敏感并具文字特征显式描述特点的LHBP模式的纹理描述算子;并在LHBP模式上采用多尺度向性滤波器MDF(multi-scaledirectional filtering)来确定候选文字区域;最后使用基于LHBP直方图的支持向量机法精确定位文字区域。实验结果表明,与其他主流算法相比,该算法能够去除复杂光照条件和文字—背景交融的影响,具有更好的性能。 许鹏飞 姚鸿勋 纪荣嵘 王积成 孙晓帅关键词:文字检测 HAAR小波 支持向量机 基于部件检测的细粒度图像分割 2019年 细粒度图像中物体的分割是具有挑战性的,因为这类图像一般具有很大的表观变化和混杂的背景。大多数已有的分割方法都不能以足够的准确率将细粒度图像中物体的细小部件分割出来。然而在细粒度识别任务中,这些细小的部件通常包含了对细粒度分类极为重要的语义信息。通过观察发现,细粒度物体通常在类间共享相同的部件种类,本文由此提出一种新颖的基于部件检测的细粒度图像分割方法。该方法明确地检测部件在图像中的位置,给出部件位置假设。然后通过不断地迭代更新部件假设和分割的输出假设,以获得更优的分割效果。实验表明本文方法能够很好地保留具有语音信息的部件,提高细粒度分类的准确率。 庞程 姚鸿勋 孙晓帅关键词:GRABCUT 图像分割 图像分类 一种结合空间约束信息获取动作类别的方法 一种结合空间约束信息获取动作类别的方法,涉及自动化监控领域,它解决了目前获取动作分类的方法训练时间过长和分类精度不高的问题。它的步骤为:读取视频,利用snake和粒子滤波器对目标轮廓区域内的目标进行跟踪,并在每一帧中都用... 姚鸿勋 刘天强 纪荣嵘 孙晓帅文献传递 视觉注意与显著性计算综述 被引量:8 2014年 人类视觉系统通过选择性视觉注意机制来对场景中位于重要位置的视觉内容进行动态的序列采样,进而获取必要的视觉信息。本文系统地总结了计算化注意模型和显著度计算领域的研究现状。通过在YORK-120和MIT-1003这两个国际标准数据库上进行的人眼视点预测实验,本文对20种计算模型的实际性能进行了详细的评估和对比。结果表明,基于统计的模型要比其它的方法更容易获取较好的预测结果。 孙晓帅 姚鸿勋关键词:视觉注意 一种视频中的人物动作检测方法 一种视频中的人物动作检测方法,它涉及一种基于内容的视频检测方法,以解决现有的多媒体信息检索方法不能够检测视频素材中的动作信息的问题。本发明通过基于Graph Partition Model的镜头边界检测方法对视频的镜头进... 姚鸿勋 纪荣嵘 孙晓帅 许鹏飞文献传递 一种结合空间约束信息获取动作类别的方法 一种结合空间约束信息获取动作类别的方法,涉及自动化监控领域,它解决了目前获取动作分类的方法训练时间过长和分类精度不高的问题。它的步骤为:读取视频,利用snake和粒子滤波器对目标轮廓区域内的目标进行跟踪,并在每一帧中都用... 姚鸿勋 刘天强 纪荣嵘 孙晓帅文献传递 深度学习中的自编码器的表达能力研究 学习框架和非监督学习方法近年来越来越流行,吸引了很多机器学习和人工智能领域研究者们的兴趣.最近的研究结果也证明了深度学习方法确实能够取得非常好的结果,无论是在图像、语音或是自然语言处理领域.虽然深度学习方法取得了很好的结... 王雅思 姚鸿勋 孙晓帅 许鹏飞 赵思成关键词:数据降维