国家自然科学基金(60873255) 作品数:5 被引量:24 H指数:3 相关作者: 李伟 李晓强 汪竹蓉 刘亚多 冯瑞 更多>> 相关机构: 复旦大学 上海大学 更多>> 发文基金: 国家自然科学基金 上海市科委重大科技攻关项目 上海市科委科技攻关项目 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
压缩域鲁棒音乐指纹算法研究 被引量:9 2010年 对互联网海量MP3格式音乐数据进行基于内容的有效检索是当前一个重要而又很少涉及的研究方向.本文提出一种基于MDCT频谱熵的压缩域音频指纹算法,对各种常规频域和时间域的音频信号处理失真具有较强的鲁棒性.模拟实验在包含100首不同中文流行歌曲的音乐数据库上进行.对经受各种严重信号处理失真的粒度为5s左右的查询片段,能够取得超过90%的首位正确识别率. 刘亚多 李伟 李晓强 汪竹蓉 冯瑞关键词:压缩域 鲁棒性 音乐检索 多版本音乐识别技术研究综述 被引量:3 2012年 音乐作品通常具有多个不同版本.重新演奏、演绎使得各版本音乐在音质、速度、节奏、结构、基调、和声、歌词等多个方面都可能产生不同,这使得多版本音乐识别成为一个具有挑战性的研究领域.近年来多版本音乐识别技术发展迅速,本文对其包含的五个关键技术模块进行描述,分别是特征提取模块、基调不变性模块、速度不变性模块、结构不变性模块、相似性计算模块;其次概要介绍该领域的典型算法;最后总结当前存在的问题,并讨论进一步的研究方向. 肖川 李伟 殷玥 薛敏 朱碧磊 冯瑞基于音乐内容分析的音频认证算法 被引量:2 2012年 提出一种新颖的基于音符分割和模糊分类的音乐内容认证方法.该算法打破了传统音频认证所采用的固定长度分割方式,将音乐信号分割成一系列具有完整语义信息的不等长音符片段作为认证的基本单元,结合动态时间规整DTW(dynamic time warping)对齐技术,有效解决了大多数现有算法都存在的对同步失真脆弱的问题.在每个音符片段计算基于半阶音符类Chroma的鲁棒Hash值,根据原始音乐与待认证音乐之间Hash值差异的统计特性和时间分布特性,对3种新定义的度量指标进行模糊分类从而得到最终的认证结果.对于未通过认证的音乐信号系统还可以进行篡改区域的检测.实验结果表明,该算法能够有效区分可容许操作和恶意篡改,同时在篡改定位方面具有较高的精度. 汪竹蓉 李伟 朱碧磊 李晓强关键词:篡改定位 基于表面粗糙度的三维模型质量评价研究 被引量:5 2011年 数字水印的嵌入会引起三维模型数据的失真,正确评价含水印三维模型的质量可以为三维水印算法的测评提供统一标准。提出了一种新的三维模型质量的评价方法,它首先利用网格模型中二面角为基本度量单位计算出整个原始三维模型的粗糙度,然后在嵌入水印以后用同样的方法计算出含水印三维模型的粗糙度,最后得到嵌入水印前后粗糙度的增量,并将其作为水印嵌入对三维模型造成的失真度的度量。大量实验结果表明,相比传统的质量评价方法,该方法更加适用于三维网格模型。该质量评价方法还可用于评价各种水印攻击对含水印三维模型造成损害的程度。 杨斌 李晓强 李伟 丁广太关键词:三维模型数字水印 粗糙度 水印算法 数字音频认证研究综述 被引量:6 2009年 现代音频信号处理技术使得对音频内容的篡改、替换,对时间序列的调换顺序等恶意操作可以以极低的代价进行,对音频完整性和真实性进行认证变得日益重要。对人类听觉系统来讲,音频认证技术需要保护的是音频内容而不是比特流本身,因此它应该能够容忍一些保持音频听觉质量或者语义的正常信号处理操作而不触发检测器。介绍了音频内容认证技术的产生背景、典型应用场合、需满足的必要性质、硬认证与软认证的特点、保持内容操作和恶意操作的划分,综述了典型的音频内容认证算法,最后总结并讨论了该研究领域的技术特点并提出了可能的解决方案。 李伟 汪竹蓉 李晓强 刘亚多关键词:重同步