陈柯
- 作品数:5 被引量:12H指数:2
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于三角剖分的人脸纹理映射被引量:7
- 2007年
- 采用通用的三维人脸模型和任意的人脸纹理图像,基于Delaunay三角剖分,提出了一种灵活的3D人脸的纹理映射方法。该方法对人脸特征点集做三角剖分,在纹理图像和三维网格之间建立了一个准确的拓扑同构映射关系,从而得到高真实度的纹理映射。该算法不受网格调整精度的影响,同时适用于不同的纹理映射到同一三维人脸模型上。
- 陈柯杜利民赵向阳汪志鸿
- 关键词:人脸重建纹理映射DELAUNAY三角剖分
- 语音浏览器的概念、框架和应用
- 2007年
- 分析了语音浏览器的概念和框架,以及语音输入、对话管理和响应生成整个口语对话过程的标记规范,重点说明了语音浏览器的核心标准VoiceXML的原理和工作特性,并描述了应用语音浏览器创建口语对话系统的整体方案。以此为基础,本文给出了语音浏览器在股票交易系统中的具体应用实例。通过语音浏览器平台,可以创建灵活性很强的混合主导对话模式的口语对话系统。
- 汪志鸿张海云陈柯杜利民
- 关键词:语音浏览器VOICEXML口语对话系统
- 汉语语音视觉合成研究数据库CVSS1.0被引量:3
- 2007年
- 目前现有的双模态语音数据库多为外文,且绝大部分都是为语音识别或身份认证服务的。鉴于此,我们根据汉语语音的特点,建立了国内第一个较为完备的汉语语音视觉合成数据库CVSS1.0。它具有如下特点:包含136个单音节和265个连续发音语句的视频和音频数据,其语料规模超出目前同类数据库;语料是在汉语发音方式归类的基础上,依据汉字出现频度的高低选取,其中的独白语句涵盖了大部分的韵律结构,因此其反映的规律具有代表性;记录了脸部发音动作的三维运动信息;用绿点标出了部分MPEG4定义的脸部特征点,方便跟踪;可服务于多种视觉语音合成研究,有很高的通用性。
- 张欣杜利民陈柯赵向阳
- 关键词:数据库语料MPEG4
- 基于主动形状模型的人脸特征建模被引量:2
- 2006年
- 论文基于主动形状模型,提出了一种新的人脸特征建模方法,并详细介绍了唇部形状的建模过程。该方法从人脸数据库中提取一定的训练集,对唇部形状进行标注、校准和统计分析,可以得到唇部的变形模式,每种变形模式对应形状协方差矩阵的一个特征值,而最大的N(N<10)个特征值对应的主要变形模式可以还原出98%的形状变化。实验证明,该方法以非常小的信息损失为代价,仅用少量的参数就可以描述绝大部分的视觉特征。
- 陈柯杜利民
- 关键词:主动形状模型
- 语音驱动的人脸动画关键技术研究
- 陈柯
- 关键词:计算机图形学计算机动画图像处理人脸动画