张焱
- 作品数:15 被引量:64H指数:5
- 供职机构:南京理工大学更多>>
- 发文基金:江苏省自然科学基金国防科技技术预先研究基金国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术环境科学与工程兵器科学与技术更多>>
- 自动语音识别理论及应用研究-广义模型、混合模型和听觉模型
- 该文研究了语音识别理论技术及实现.主要包括七个方面内容:第一,研究了广义模型对语音信号的建模,给出了广义模型的训练算法;第二,提出了汉语音节声韵母声学单元的重叠音素分割策略及小波变换分割算法;第三,研究了声母声学单元细分...
- 张焱
- 关键词:语音信号处理声学模型语音特征隐马尔可夫模型听觉模型动态时间规正
- 文献传递
- 语音识别中动态时间规整和隐马尔可夫统一模型被引量:13
- 1997年
- 对于目前在语音识别中广泛使用的两种技术即动态时间规整(DTW)技术和隐马尔可夫模型(HMM)的本质联系,提出了二者的统一模型(DHUM,DTWandHMMUni-fiedModel),并分别给出DTW和HMM向DHUM的转换关系。文中还提出了用DHUM解决更接近语音实际情况的高阶HMM作语音识别时所面临的运算量过大的问题。中等词表的识别实验结果表明,建立在DHUM之上的识别器的识别性能不低于DTW和HMM识别器。
- 张焱张杰黄志同
- 关键词:语音识别动态时间规整隐马尔可夫模型
- 基于动态时间规整和隐马尔可夫统一模型的无端点检测的汉语识别算法
- 1998年
- 根据汉语语音的特点,提出了一种无端点检测的语音识别算法。在识别过程中,该算法无需确定语音信号起止点位置,而是从寂静段开始,直接按帧提取特征(帧长20ms,帧间重叠50%),特征向量由15阶倒谱系数和帧平均能量组成。在动态时间规整(DTW)和隐马尔可夫(HMM)统一模型(DHUM)中,引进寂静段自环,并用DHUM实现了该算法。对99个相似汉语单字的识别实验表明:无端点检测的识别器正识率为94.95%,正识率下降很少,但不作端点检测却降低了算法的复杂程度。该算法中,若特征向量采用一种听觉模型特征,识别器具有更好的鲁棒性,识别率会略有提高。
- 张杰张焱黄志同
- 关键词:语音识别端点检测汉语语音隐马尔可夫模型
- 语音信号基本载体的研究被引量:1
- 1996年
- 语音信号特征的提取是语音识别的基础。目前使用的特征提取方法要将语音信号经多次复杂变换(如傅里叶变换、自相关变换等)后提取特征。这样,往往满足不了实时性要求。该文对原始语音信号做简单处理(如切顶、转换成直方波形等)的实验,证明经简单处理后语音信号波形比原始波形简单、直观,计算频域特征和自相关特征简单方便、实时性好。
- 马明张焱王建宇黄志同
- 关键词:语音信号处理语音识别数据压缩语音信号
- 染料废水治理技术研究
- 该文探索了新型染料废水的处理技术.在预处理阶段研究了几种絮凝剂的作用,包括PAC、PAM、脱色剂.通过它们单独作用后的色度及COD<,Cr>去除率得出最佳絮凝剂浓度,再分别将PAC/PAM、PAC/脱色剂组合使用,得出最...
- 张焱
- 关键词:染料废水微电解TIO<,2>光催化超声波降解絮凝
- 文献传递
- 语音识别中隐马尔可夫模型状态数的研究被引量:20
- 1998年
- 该文从信息论的观点出发,对语音信号的隐马尔可夫模型(HMM)的状态数进行研究,建立了HMM的状态数研究的简化模型,指出HMM的信息熵是由语音信号的固有熵和附加熵组成。随状态数增加,信息熵趋向固有熵。最后,在综合考虑信息熵和运算量两方面因素情况下,得出的状态数宜在6~8之间的结论。
- 张焱张杰黄志同
- 关键词:语音识别隐马尔可夫模型
- 基于一种听觉模型的特征提取及语音识别被引量:10
- 1998年
- 该文分析了人耳耳蜗及中枢听觉神经对声信号处理的机理,主要包括耳蜗对声信号的频率分析、柯蒂氏器官毛细胞的从振动机械能到电化学能的转换、听神经的侧抑制神经网络(LIN)和增益调整四个层次,建立各个层次上听觉的数学模型。模型的最终输出即为用于识别的语音特征。辨识实验结果也表明此听觉模型特征能较好地表征语音本质。
- 张焱张杰黄志同
- 关键词:语音识别信号处理听觉模型特征提取
- 基于听觉模型的鲁棒性语音识别的研究被引量:1
- 1998年
- 本文在一定层次上(主要是耳蜗和中央听觉神经系统)对人耳的声信号的处理机理进行研究,提出了一种用于语音识别的听觉模型。从理论上对这种听觉模型的噪声鲁棒性进行了分析,得出建立在这种听觉模型之上的语音识别前端处理器具有良好的噪声鲁棒性。同线性预测系数倒谱(LPC-CEP)特征的对比实验结果也证明了基于听觉模型语音特征的噪声鲁棒性性要大大优于LPC-CEP特征。
- 张焱张杰黄志同
- 关键词:听觉模型语音识别鲁棒性信号处理
- 基于汉语单字尾音可切除原则的连接词识别算法
- 1998年
- 本文指出,如果适当切除单字部分音尾特征,识别率不会明显下降,甚至有所提高,而识别时间明显缩短。分析和实验结果表明:若采用动态时间规正算法(DTW),识别时间与特征矢量长度的平方成正比关系。本文对上述现象进行了探讨,并给出了直观解释。实验指出,音尾特征的截除极限为特征矢量总长度的1/3。根据上述实验事实,从假设-检验的认知理论出发,提出一种汉语连接词的识别算法,并在DTW模型上得以实现。实验测试集包括200个特定人发音样本,其中2字词162个,3字词22个,4字词16个,正确识别率为91%。该算法对待识词的长度没有限制,并且随待识长度的增加,识别时间只作线性增长。
- 张杰张焱黄志同
- 关键词:言语识别语言信号处理
- 差量式高速高精度数字伺服系统的研制,链式炮凸轮机构运动规律的测试
- 张焱