国家自然科学基金(61070117) 作品数:4 被引量:6 H指数:2 相关作者: 贾熹滨 包锡元 张艳华 孙艳丰 尹宝才 更多>> 相关机构: 北京工业大学 更多>> 发文基金: 北京市自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于双层码本的语音驱动视觉语音合成系统 被引量:2 2014年 提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果。 贾熹滨 尹宝才 孙艳丰关键词:语音特征 基于WPD和(2D)~2PCA的步态识别方法 被引量:1 2013年 为了提高步态识别率,在步态能量图(gait energy image,GEI)基础上,提出了基于小波包分解(waveletpacket decomposition,WPD)和完全主成分分析(two-directional two-dimensional principal component analysis,(2D)2PCA)的步态识别方法.该方法采用基于人体轮廓的GEI来解决步态数据量过大的问题,并采用WPD和(2D)2PCA进行步态特征提取,解决了已有基于小波变换的步态识别方法中高频分量丢失或维数过高问题.在NLPR步态数据库上对该方法进行了评测,并与经典方法进行了比较.实验结果表明:该方法具有更高的识别率和视角变化的鲁棒性. 杨新武 杨跃伟 翟飞关键词:步态识别 小波包分解 Kappa加权的子空间融合表情识别方法 被引量:2 2014年 为提高面部表情识别效果,提出基于Kappa计算面部表情图像子区域对表情的贡献程度,并线性加权子空间预测结果.将标准化后的人脸表情图像上下平均分割成2个子区域,确定上半脸和下半脸及全脸3个表情子空间,采用Gabor小波特征,分别利用SMO、MLP和KNN三种分类器,统计并计算基于Kappa的子空间表情信息.在Cohn-Kanade和JAFFE两个表情图像库进行测试,实验结果表明:基于Kappa加权融合的表情识别方法识别率更高. 贾熹滨 张艳华 包锡元关键词:GABOR小波 加权融合 基于动态图像序列的表情识别 被引量:1 2013年 为提高表情表述能力,提出建立组合单帧表情空域特征的表情序列联合特征.在分析Gabor小波的不同方向和尺度组合对表情图像表征能力基础上,确定采用3个方向和2个尺度的Gabor滤波器组提取单帧表情图像特征,描述表情动作的空域特征.在此基础上,组合连续表情图像序列的特征,建立包含表情动作变化过程的联合特征,解决了利用表情相关的局部空域和时序变化信息建立表情表述模型问题.利用支持向量机(SVM)作为分类器分别在JAFFE静态表情数据库和Binghamton动态表情数据库上进行测试,结果验证了静态图像采用Gabor+PCA特征比PCA特征更具有效性,表明利用动态表情序列建立表情特征比用静态表情图像具有更高的表情识别正确率. 贾熹滨 闻春城 包锡元关键词:表情识别 表情特征