针对当前不同的非白噪声背景研究很少,根据噪音、语音和音乐的性质并且结合统计学理论,提出一种在不同噪声背景下低信噪比的语音/音乐分割算法。以往的检测算法很少考虑低信噪比的环境,首先从音频数据中提取新的特征参数概率密度比(probability density ratio,PR)和概率密度比过零率(probability density ratio crossing rate,PRCR),特征参数在低信噪比环境下亦能明显表征语音和音乐的不同特性,然后根据音频的特性对PRCR进行修正,再基于此修正的特征参数对语音和音乐进行改变点检测,最后得到分割结果。实验结果显示,在信噪比达到5dB时分割点准确率达到85%以上,具有良好的鲁棒性。
在音频质量客观评价(Perceptual Evaluation of Audio Quality,PEAQ)尤其是音频系统的在线评测时,参考信号与测试信号不可避免地存在系统延迟。计算参考与测试之间的延迟误差从而实现信号之间的时间同步将是影响音频质量客观评价结果的关键性问题。针对此问题,通过信号的包络求取、信号频域间的互相关及频域直方图等方法给出了一种实时高效的音频延迟算法。通过实际测量,该算法在广播音频质量在线监测系统中充分体现了实时、稳定和高效的特点。