王振华
- 作品数:2 被引量:3H指数:1
- 供职机构:杭州电子科技大学自动化学院生物医学工程与仪器研究所更多>>
- 发文基金:国家自然科学基金浙江省重大科技专项基金浙江省科技厅新苗人才计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于分形维数的图像质量客观评价方法研究被引量:2
- 2009年
- 建立图像质量客观评价模型对于图像编码、增强、重建以及分析等领域具有重要的现实意义。鉴于传统的图像质量评价方法的评价结果与主观感知存在较大的误差等缺陷,为此从分形角度考虑,并兼顾人眼视觉特性,首先提取了分形维数作为图像质量的评价指标;然后从非线性角度来表征引起人眼视觉敏感变化的图像亮度以及纹理信息,并将能准确反映图像质量变化的空隙度参数作为有效补偿;最后采用线性回归分析直接对图像进行建模,并将分形维数差值和空隙度差值两分量表示在统一的模型中。实验证明,相对于传统的PSNR和SSIM评价指标而言,该评价模型不仅对于不同类型的失真、相同失真类型的不同失真级别的图像能够准确进行评估,而且与主观评价值(MOS)具有更好的关联性,即与人眼视觉感受具有较高的吻合性,同时能够实现对图像质量进行全面、科学的评价。
- 庞全王振华耿丽硕范影乐
- 关键词:分形维数空隙度峰值信噪比
- 根据语音分形维和基音周期的说话人性别识别研究被引量:1
- 2008年
- 根据语音特征实现说话人性别的自动识别,在音频处理与分析中具有重要的应用意义。为了克服语音常规线性参数在刻画说话人性别特征上的不足,本文使用了分形维等非线性参数作为特征空间的有效补偿。首先利用提升算法实现基音周期的提取;然后提取语音的分形维数;最后根据Takens定理,对分形维进行了重构,采用求近似熵的方法得到分形维复杂度。将基音周期、分形维数以及分形维复杂度构成三维向量,进行说话人的性别识别。实验证明,通过非线性参数的介入,与仅使用基音周期等传统线性特征的识别方法相比,识别系统的准确率和稳定性得到有效提高,因此为说话人性别识别提供了一个新的思路。
- 王振华杨翠容武薇范影乐
- 关键词:性别识别分形维数基音周期