吴海洋 作品数:6 被引量:8 H指数:1 供职机构: 东南大学信息科学与工程学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
矢量泰勒级数特征补偿的说话人识别 被引量:6 2013年 将矢量泰勒级数(Vector Taylor Series,VTS)特征补偿算法应用于说话人识别,给出了卷积噪声方差的近似闭式解,构建了联合快速估计卷积噪声和加性噪声均值和方差的框架。该算法可在无需失配环境先验信息的前提下,直接从失配语音中估计出卷积噪声和加性噪声的均值和方差,实现对环境失配的补偿。实验结果表明,在信道变化较大的无线信道下,卷积噪声方差的补偿最高可降低误识率3.24%.提升了系统的识别性能。在存在加性噪声的无线信道下,与基于线性失真模型的特征映射算法和倒谱均值减算法相比,本文算法可分别最大降低49.65%和68.06%的误识率,适合于信道变化较大的失配环境补偿。 吴海洋 杨飞然 周琳 吴镇扬关键词:说话人识别 泰勒级数 矢量 噪声方差 无线信道 一种有限误差线谱频率参数暂时分解量化算法 被引量:1 2009年 本文对线谱频率参数量化提出了一种有限误差的暂时分解算法。新算法以原有的暂时分解算法为基础,重新定义了误差约束条件下的插入事件产生规则,并引入了事件消除机制。实验表明,在相同的编码速率下与原算法相比,该算法在对线谱频率参数量化过程中能够取得更低的平均谱失真度,从而获得更高的语音质量,更适用于低速率语音编码系统。 汤一彬 吴海洋 吴镇扬关键词:低速率语音编码 目标不同视角下观察信息的迁移和再利用 被引量:1 2013年 基于视觉信息的目标检测和识别模型在训练时往往依赖于来自于训练样本的视角信息,然而附带了视角信息的训练样本通常只有很少的数据库可以提供。当此类信息缺失时,传统的通用目标检测系统通常通过一些非监督学习方法来对样本的视角信息进行粗略估计。本文改进并引入了一种选择性迁移学习方法即TransferBoost方法来解决目标视角信息缺失的问题。TransferBoost方法基于GentleBoost框架实现,通过重新利用其他类别样本中的先验信息来提升当前类别样本的学习质量。当给定一个标定完善的样本集作为源数据库时,TransferBoost同时调整每个样本的权值和每个源任务的权值,实现样本级和任务级的两级知识迁移。这种双层迁移学习更有效地从混合了相关源数据和不相关源数据的数据集中提取了有用的信息。实验结果表明,和直接使用传统的机器学习方法相比较,迁移学习方法所需要的训练样本数大大减少,从而降低了目标检测与识别系统的训练代价,扩展了现有系统的应用范围。 张索非 吴海洋 吴镇扬关键词:目标识别 目标检测 基于非负矩阵分解的1kbit/s波形内插语音编码算法 2010年 为了进一步降低编码速率,提出了一种基于非负矩阵分解的1kbit/s波形内插语音编码算法.该算法对特征波表面的幅度矩阵进行非负矩阵分解,以获得局部特征矩阵,并对该局部特征矩阵进行约束和改进,使优化后局部特征更加突出.对应的基矢量进一步稀疏,从而有利于对权矢量的量化,以实现对特征波表面的高效编码.该算法同时加入清浊音标志,对特征波表面的相位谱进行估计,以更好地提高合成语音质量.实验表明,该算法能够在1kbit/s的低编码速率条件下,获得与1.2kbit/s混合激励线性预测语音编码算法相近的合成语音质量,取得了较好的效果. 汤一彬 吴海洋 吴镇扬关键词:非负矩阵分解 波形内插 一种自适应速率的线谱频率参数暂时分解量化算法 低速率语音编码中的暂时分解算法能够在一定的失真准则下有效地对参数数据进行量化压缩从而降低编码速率,其中失真门限的选取对编码速率的确定有着极其重要的影响.本文在一种有限误差暂时分解算法的基础上对失真门限进行调节,提出了一种... 汤一彬 吴海洋 吴镇扬关键词:低速率语音编码 文献传递 基于VQMAP模型和AdaBoost学习算法的说话人识别 2010年 为了解决传统说话人识别系统在集成学习后识别速度变慢且容易过学习的问题,构造了一种基于最大后验矢量量化(VQMAP)模型和自适应提升(AdaBoost)学习算法的说话人识别系统.首先,分析了说话人识别系统中基分类器性能对集成分类器泛化误差的影响.然后,针对说话人的类别数,构造适当精度的VQMAP模型.最后,利用包含提前终止策略的AdaBoost学习算法将该模型提升为强分类器.实验结果表明:该算法的识别速度较高,是最大后验高斯混合模型(GMMMAP)的9倍;该算法可有效控制AdaBoost学习算法在说话人识别中的过学习问题,其性能优于VQMAP模型,且在训练数据较少或者类别数可预计的情况下,其性能可接近甚至超过GMMMAP模型. 吴海洋 吕勇 吴镇扬关键词:说话人识别