国家自然科学基金(61203258)
- 作品数:3 被引量:3H指数:1
- 相关作者:陶建华张大伟刘斌莫福源赖玮更多>>
- 相关机构:中国科学院自动化研究所北京师范大学中国科学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
- 相关领域:语言文字自动化与计算机技术电子电信更多>>
- 汉语无标记疑问句的语调分析与建模被引量:1
- 2018年
- 语音工程中疑问句基频的生成有赖于对疑问句语调走势的全局把握与量化建模。该文以疑问句和陈述句的音高曲线的回归线代表语调走势,结合实验语料和自然语料对二者语调进行分析。发现音高曲线的回归斜率是区别陈述句与疑问句语调的重要韵律特征,该特征受句子长度、时域范围等因素影响,在2种句型中有不同的表现。用反函数对疑问句语调斜率的变化规则进行建模,取得了较高的拟合优度,为疑问句语调走势的预测与生成提供了可靠依据。
- 许小颖赖玮赖玮丁星光李雅
- 关键词:语调韵律
- 面向X光发音视频的舌位轮廓自动提取方法被引量:1
- 2014年
- 发音器官的X光视频为分析人的发音过程提供了重要数据,但由于其存在成像模糊、遮挡严重等问题,使得X光视频中舌位运动轮廓往往难以提取,为此提出一种接近全自动的X光视频中舌位轮廓提取方法.首先采用区域灰度对比的边缘检测算子在舌位运动区域中获取初步边缘点集合;针对X光图像是高噪声图像且舌位轮廓常被其他发音器官如牙齿等遮挡,造成初步边缘点集合中包含了很多的错误点,进一步提出一种基于邻接点簇的点到点距离比错误点排除法,得到较高精度的舌位轮廓边缘点集合;最后借助RANSAC和过控制点B样条曲线拟合技术,提取出整个舌位边缘轮廓点.实验结果表明,该方法获得的舌位轮廓精度高,可用于舌位连续发音运动特征的分析.
- 张大伟杨明浩陶建华
- 面向窄带通信的极低速率语音编码算法研究被引量:1
- 2013年
- 提出了一种面向窄带通信的极低速率参数语音编码算法。在2.4kbps MELP标准的基础上结合听觉感知,对线谱对参数进行联合矢量量化、对基音周期进行内插和非线性量化、对能量参数进行高效压缩,可以使语音数据在0.5kbps下匀速传输;线谱对参数的预测残差用于矢量量化,这是一种提高合成语音的音质的有效方法。实验结果表明,采用本文提出的语音编码算法可以使语音数据在极低码率下有效的传输,解码端合成的语音具有较高的可懂度。
- 刘斌陶建华莫福源
- 关键词:听觉感知