您的位置: 专家智库 > >

陈柯

作品数:5 被引量:12H指数:2
供职机构:中国科学院声学研究所更多>>
发文基金:国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 4篇期刊文章
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 1篇电子电信

主题

  • 3篇语音
  • 2篇人脸
  • 1篇动画
  • 1篇映射
  • 1篇语料
  • 1篇语音驱动
  • 1篇语音浏览器
  • 1篇人脸动画
  • 1篇人脸重建
  • 1篇三角剖分
  • 1篇视觉
  • 1篇数据库
  • 1篇图像
  • 1篇图像处理
  • 1篇图形学
  • 1篇剖分
  • 1篇主动形状模型
  • 1篇浏览
  • 1篇浏览器
  • 1篇纹理

机构

  • 5篇中国科学院
  • 1篇中国科学院研...

作者

  • 5篇陈柯
  • 4篇杜利民
  • 2篇赵向阳
  • 2篇汪志鸿
  • 1篇张海云
  • 1篇张欣

传媒

  • 3篇微计算机应用
  • 1篇计算机工程与...

年份

  • 3篇2007
  • 1篇2006
  • 1篇2005
5 条 记 录,以下是 1-5
排序方式:
基于三角剖分的人脸纹理映射被引量:7
2007年
采用通用的三维人脸模型和任意的人脸纹理图像,基于Delaunay三角剖分,提出了一种灵活的3D人脸的纹理映射方法。该方法对人脸特征点集做三角剖分,在纹理图像和三维网格之间建立了一个准确的拓扑同构映射关系,从而得到高真实度的纹理映射。该算法不受网格调整精度的影响,同时适用于不同的纹理映射到同一三维人脸模型上。
陈柯杜利民赵向阳汪志鸿
关键词:人脸重建纹理映射DELAUNAY三角剖分
语音浏览器的概念、框架和应用
2007年
分析了语音浏览器的概念和框架,以及语音输入、对话管理和响应生成整个口语对话过程的标记规范,重点说明了语音浏览器的核心标准VoiceXML的原理和工作特性,并描述了应用语音浏览器创建口语对话系统的整体方案。以此为基础,本文给出了语音浏览器在股票交易系统中的具体应用实例。通过语音浏览器平台,可以创建灵活性很强的混合主导对话模式的口语对话系统。
汪志鸿张海云陈柯杜利民
关键词:语音浏览器VOICEXML口语对话系统
汉语语音视觉合成研究数据库CVSS1.0被引量:3
2007年
目前现有的双模态语音数据库多为外文,且绝大部分都是为语音识别或身份认证服务的。鉴于此,我们根据汉语语音的特点,建立了国内第一个较为完备的汉语语音视觉合成数据库CVSS1.0。它具有如下特点:包含136个单音节和265个连续发音语句的视频和音频数据,其语料规模超出目前同类数据库;语料是在汉语发音方式归类的基础上,依据汉字出现频度的高低选取,其中的独白语句涵盖了大部分的韵律结构,因此其反映的规律具有代表性;记录了脸部发音动作的三维运动信息;用绿点标出了部分MPEG4定义的脸部特征点,方便跟踪;可服务于多种视觉语音合成研究,有很高的通用性。
张欣杜利民陈柯赵向阳
关键词:数据库语料MPEG4
基于主动形状模型的人脸特征建模被引量:2
2006年
论文基于主动形状模型,提出了一种新的人脸特征建模方法,并详细介绍了唇部形状的建模过程。该方法从人脸数据库中提取一定的训练集,对唇部形状进行标注、校准和统计分析,可以得到唇部的变形模式,每种变形模式对应形状协方差矩阵的一个特征值,而最大的N(N<10)个特征值对应的主要变形模式可以还原出98%的形状变化。实验证明,该方法以非常小的信息损失为代价,仅用少量的参数就可以描述绝大部分的视觉特征。
陈柯杜利民
关键词:主动形状模型
语音驱动的人脸动画关键技术研究
陈柯
关键词:计算机图形学计算机动画图像处理人脸动画
共1页<1>
聚类工具0