阐述了基于动态时间规整DTW(Dynamic Time Warping)语音识别算法的基本原理及存在的不足,提出联合频谱分析和DTW的双层分类语音识别算法,首先用频谱分析方法对待识别语音按字数进行初步分类,然后再用传统的DTW进行模式匹配得到识别结果。通过实验验证提出的算法是有效的,比传统的DTW算法平均速度提高了1.1倍。
在语音识别中,噪声严重影响语音特征提取,使得正确率明显下降。针对这一情况,提出了子带加权平均语音识别算法(Sub-Band Weighted Average Speech Recognition,SBWASR),在噪声环境下,该方法能有效地提高语音识别的准确性。最后通过实验验证特定条件下该方法是正确有效的。