国家杰出青年科学基金(60525202)
- 作品数:4 被引量:89H指数:2
- 相关作者:吴朝晖王跃明潘纲杨莹春韩松更多>>
- 相关机构:浙江大学更多>>
- 发文基金:国家自然科学基金国家杰出青年科学基金长江学者和创新团队发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- MASC@CCNT:面向说话人识别的汉语情感语音库
- 本文在对现有情感语音库进行综述和分析的基础上,提出并构建了用于说话人识别的情感语音库MASC@CCNT(Mandarin Affective Speech Corpus from CCNT Lab),该语音库的特点是:针...
- 杨莹春吴甜李冬冬单振宇黄挺
- 关键词:情感语音说话人识别
- 文献传递
- 三维鼻形:一种新的生物特征识别模式被引量:6
- 2008年
- 鼻子是脸部最显著的器官之一,首次用三维鼻形作为生物特征进行身份识别,并提出了有效的三维鼻形识别方法,包括基于特征点的鼻子区域定位、利用ICP方法进行鼻形对齐、相似度量定义3个步骤.在FRGC 1.0数据库上获得3.15%的等错误率和92.1%的rank-1识别率,实验结果表明,采用三维鼻形有较强的判别能力.
- 韩松潘纲王跃明吴朝晖
- 关键词:三维人脸识别ICP双边滤波
- 基于语音音乐混合状态检测的音量自动调节系统
- 日常生活中,人们的交谈经常受到背景音乐的干扰,需要用户手动的调节播放器的音量。这对用户来说是极其不方便的。本文介绍了我们开发的一个实时控制播放器音量的系统,它能感知背景音乐是否打扰到用户的谈话,据此自动调节播放器的音量,...
- 单振宇潘纲杨莹春
- 关键词:音乐上下文感知
- 文献传递
- 一个情境感知的数据管理中间件
- 本文给出了一个情境感知的数据管理中间件框架,其包括情境信息的处理机制和根据特定情境获取数据服务的原理。基于此框架,我们采用Java语言及类库,实现了一个情境感知的数据管理平台,并通过实验,总结了开发普适计算环境下系统的一...
- 张犁孙洁潘纲吴朝晖
- 关键词:情境感知中间件元数据数据管理
- 文献传递
- 基于UBM降阶算法的高效说话人识别系统被引量:2
- 2009年
- 为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率.
- 单振宇杨莹春
- 关键词:说话人识别高斯混合模型
- 三维人脸识别研究综述被引量:79
- 2008年
- 近二十多年来,虽然基于图像的人脸识别已取得很大进展,并可在约束环境下获得很好的识别性能,但仍受光照、姿态、表情等变化的影响很大,其本质原因在于图像是三维物体在二维空间的简约投影.因此,利用脸部曲面的显式三维表达进行人脸识别正成为近几年学术界的研究热点.文中分析了三维人脸识别的产生动机、概念与基本过程;根据特征形式,将三维人脸识别算法分为基于空域直接匹配、基于局部特征匹配、基于整体特征匹配三大类进行综述;对二维和三维的双模态融合方法进行分类阐述;列出了部分代表性的三维人脸数据库;对部分方法进行实验比较,并分析了方法有效性的原因;总结了目前三维人脸识别技术的优势与困难,并探讨了未来的研究趋势.
- 王跃明潘纲吴朝晖
- 关键词:人脸识别三维人脸识别深度数据
- 基于基频的情感语音聚类的说话人识别方法被引量:2
- 2009年
- 针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率.
- 李冬冬吴朝晖杨莹春
- 关键词:情感语音基频说话人识别