陈志高
- 作品数:2 被引量:8H指数:1
- 供职机构:复旦大学计算机科学技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于U-Net和BGRU-RNN的实用歌声检测系统被引量:1
- 2019年
- 提出了一个基于U-Net和BGRU-RNN的实用的歌声检测方法。它包含三个步骤:歌声分离、特征提取和模式识别。首先使用深度U-Net网络对混合信号进行歌声分离(Singing Voice Separation,SVS);然后融合MFCC、Mel-filter Bank、LPCC和Chroma作为特征;考虑到音频混合信号在时序上的强相关性,采用BGRU-RNN分类器进行建模。实验表明,该方法在RWC-Pop数据集上与业界最高水平相当。
- 陈志高张旭龙肖寒肖川
- 基于熵的音频指纹检索技术研究与实现被引量:7
- 2017年
- 介绍了一种基于熵的音频指纹检索技术,该技术采用音频的熵特征作为音频的指纹特征(AFP),在检索中,该指纹特征可以用多种串匹配算法进行信息比对。实验采用最大公共字串(LCS)、编辑距离(Levenshtein Distance)和动态时间规整(DTW)算法实现指纹特征匹配,并采用一定数量的歌曲文件作为实验的测试集。每首歌曲都有一个带有不同的较大失真的音频文件或由不同歌唱家演唱的不同版本,这些带有不同的较大失真的音频文件由原曲经过不同的严重音频处理得到,比如添加噪声、加快速度、剪辑等。实验结果显示,使用的3种匹配算法均可以将训练集中所有的歌曲正确地识别出来,从而证明了基于熵的音频指纹检索技术具有准确性、鲁棒性、区分性等优良性质。
- 王伟陈志高孟宪凯李伟
- 关键词:动态时间规整