郭同强
- 作品数:17 被引量:64H指数:4
- 供职机构:浙江大学更多>>
- 发文基金:国家自然科学基金长江学者和创新团队发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于三角形约束的误差控制的图像匹配传播方法
- 本发明公开了一种基于三角形约束的误差控制的图像匹配传播方法,包括以下步骤:(1)首先匹配用户指定数量的特征点对,开始在这些特征点形成的三角形网约束下的匹配传播过程;(2)在匹配传播过程中,计算三角形对的优先级,检测出匹配...
- 庄越挺吴飞徐劼郭同强蔡胜渊
- 文献传递
- 多线性子空间可伸缩视频编码方法
- 2010年
- 针对DCT方法用单一变换核处理所有图像块而忽略图像信号的复杂统计分布的问题,通过论证视频中的图像数据和运动预测残差存在的多线性子空间分布特性,提出一种可伸缩性视频编码方法.该方法用广义主成分分析(GPCA)取代传统视频编码中所采用的DCT来对I帧和预测残差图像编码,通过对编码结果进行适当排序,使得码流可以在任意点被截断,实现精细粒度的质量可伸缩性;并借助多线性子空间的分割,实现依据人类视觉注意特性的差错保护及更好的错误隐藏.对文中方法和基于DCT的可伸缩性编码效果进行比较的结果表明,在同等压缩比的情况下,采用该方法普遍可获得比DCT更好的图像质量.
- 吴飞刘健郭同强姚蕾
- 关键词:可伸缩视频编码
- 基于三角形约束的误差控制的图像匹配传播方法
- 本发明公开了一种基于三角形约束的误差控制的图像匹配传播方法,包括以下步骤:(1)首先匹配用户指定数量的特征点对,开始在这些特征点形成的三角形网约束下的匹配传播过程;(2)在匹配传播过程中,计算三角形对的优先级,检测出匹配...
- 庄越挺吴飞徐劼郭同强蔡胜渊
- 文献传递
- 基于综合推理的多媒体语义挖掘和跨媒体检索被引量:12
- 2009年
- 为了更准确地进行跨媒体检索,需要挖掘、学习不同类型多媒体对象之间的语义关联,为此提出一种基于综合推理模型的多媒体语义挖掘和跨媒体检索技术.首先根据多媒体对象的底层特征构造推理源,根据多媒体对象的共生关系构造影响源场来进行综合推理,并构造出多媒体语义空间;然后针对不同检索例子,根据伪相关反馈为每一个检索例子自适应地选择不同的检索方法进行跨媒体检索.为了处理检索例子不在训练集合内的情况,提出了两阶段学习方法完成检索;同时还提出了一种基于日志的长程反馈学习算法,以提高系统性能.实验结果证明,该技术能够准确地挖掘多媒体语义,多媒体文档检索和跨媒体检索效果准确且稳定.
- 杨易郭同强庄越挺王文华
- 关键词:跨媒体检索多媒体文档
- 基于改进的数据驱动决策树分析的3维人体运动检索被引量:2
- 2007年
- 随着大量3维人体运动捕获数据库的出现,使得如何对人体运动数据进行高效分析和处理,从而有效利用运动捕获数据库成为一个新的挑战。为了高效地进行3维人体运动检索,首先通过从人体运动中提取一种基于3维空间变换特征规律的空间变换特征和运动的一些关键的时间特性来得到人体运动的3维时序特征;然后针对不同的训练需求,通过改进的数据驱动决策树的学习方法来分析关节点对运动相似的不同影响,并在检索过程中按照不同影响程度依次对关键点进行相似度计算;最终实现了一个高效的运动检索仿真系统。
- 向坚徐劼郭同强吴飞庄越挺
- 关键词:运动捕获决策树
- 情景式跨媒体数字城市系统被引量:4
- 2008年
- 结合虚拟现实、GIS和跨媒体技术,提出一种具有高真实感、较强交互能力的情景式数字城市系统实现方法.该方法以GIS矢量数据为空间索引,全景交互式视频为表现内容,且加载文字、图像和音频等数据,并对这些海量信息进行跨媒体数据统一建模,以实现不同类型数据的组织和管理.与通过三维图形实现城市建模相比,采用文中方法实现的系统具有数据采集高效、表现手段真实感强、建模成本低和易于扩充等优势.
- 陈铭郭同强吴飞王叶钧庄越挺
- 关键词:全景视频数字城市GIS
- 局部样条嵌入的正交半监督子空间学习算法被引量:1
- 2010年
- 为了更加准确地对图像进行聚类与分类,提出一种基于局部样条嵌入的正交半监督子空间学习算法.通过学习一个正交投影矩阵,使得训练样本中的标注数据经过投影矩阵降维后类间离散度尽量大,类内离散度尽量小;采用局部样条回归将局部低维嵌入坐标映射成全局低维嵌入坐标,使得被投影数据保持原有流形结构,并有效地利用有标注训练样本和未标注训练样本得到优化的图像表达方式.图像聚类与分类实验的结果表明了文中算法的有效性.
- 朱科邵健郭同强
- 关键词:线性鉴别分析半监督学习
- 基于位置相关的旅游信息主动推送服务系统被引量:9
- 2009年
- 结合线性四叉树、无线互联网、地理信息系统(GIS)和跨媒体技术,实现了一个具有高真实感、较强交互能力的旅游信息主动推送服务系统。该系统以GIS矢量数据为空间索引,互动式旅游知识共享平台和导游手段为表现内容,且加载文字、图像和音视频等数据,并对这些海量信息进行跨媒体数据统一建模,以实现不同类型数据的组织和管理。与现有的电子导游系统相比,该系统具有数据采集高效且低成本、信息时效性高和表现手段真实感强等优势。
- 田雷郭同强冀寿存吴斌炜
- 关键词:线性四叉树导游系统地理信息系统
- 三角形约束下的图像特征点匹配方法被引量:19
- 2010年
- 为了在特征点匹配过程中控制错误传播,提出一种基于三角形约束来进行图像特征点匹配的方法.首先检测可能误匹配或者位于变化区域的三角形,然后在后续三角形匹配细分过程中将这些三角形赋予较低优先级,从而可有效地控制错误在匹配过程中传播.实验结果表明,采用该方法能有效地控制匹配过程中的错误传播,提高匹配精度.
- 吴飞蔡胜渊郭同强庄越挺
- 关键词:图像匹配
- 基于张量表示的多模态视频语义概念检测方法
- 本发明公开了一种基于张量表示的多模态视频语义概念检测方法。包括如下步骤:1)对训练集合及测试集合中的视频镜头均提取图像、音频、文本三种模态的底层特征,每个视频张量镜头由这三种底层特征形成3阶张量来表达;2)根据视频张量镜...
- 吴飞庄越挺刘亚楠郭同强
- 文献传递