叶蕾
- 作品数:41 被引量:105H指数:6
- 供职机构:南京邮电大学更多>>
- 发文基金:国家自然科学基金江苏省普通高校研究生科研创新计划项目江苏省博士后科研资助计划项目更多>>
- 相关领域:电子电信自动化与计算机技术文化科学更多>>
- 基于压缩感知和信息隐藏的语音保密通信系统设计方法
- 本发明公开了一种基于压缩感知和信息隐藏的语音保密通信系统设计方法,嵌入系统将秘密语音嵌入载体语音得到混合语音,设计针对语音信号的压缩感知过完备字典,并将秘密语音用压缩感知自适应观测矩阵采样,得到降低维数的观测矢量,对观测...
- 杨震叶蕾徐挺挺
- 基于压缩感知重构信号的说话人识别系统抗噪方法研究被引量:17
- 2010年
- 基于语音信号在离散余弦基下的近似稀疏性,本文对语音信号采用压缩感知(Compressed Sensing)技术进行压缩和重构,即将语音信号投影到随机高斯观测矩阵,并采用线性规划(L inear Program)方法进行重构,研究了重构误差与观测矢量点数的关系,分析了噪声环境下重构信号的频谱变化情况。针对噪声环境下压缩感知重构信号比原始信号频谱变化小的特性,提出了一种基于压缩感知重构信号的说话人识别系统抗噪方法,给出了不同信噪比下获得最高识别率时压缩感知观测矢量的最佳点数。
- 叶蕾郭海燕杨震
- 关键词:压缩感知单纯形法说话人识别
- 一种基于Transformer模态内感知和模态间交叉融合的多模态情感识别方法
- 本发明公开了一种基于Transformer模态内感知和模态间交叉融合的多模态情感识别方法,步骤包括:首先,对语音和文本进行编码提取深度特征,然后基于本发明提出的基于Transformer的模态内感知模块,捕获各个模态内部...
- 孙林慧苏继绮王静李平安叶蕾
- 文本无关的说话人识别系统抗噪方法研究
- 2010年
- 研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。
- 叶蕾方鹏
- 关键词:语音识别说话人识别文本无关高斯混合模型
- 一种基于三模态Mamba交互和级联分层融合的多模态情感识别方法
- 本发明公开了一种基于三模态Mamba交互和级联分层融合的多模态情感识别方法,步骤包括:首先,对语音、文本和视频进行编码提取深度特征,通过本发明提出的基于三模态Mamba交互模块捕获不同模态信息长距离的依赖关系,并利用不同...
- 孙林慧汤熠陈帅潼李平安叶蕾
- 基于小波变换和压缩感知的低速率语音编码方案被引量:27
- 2010年
- 本文提出一种新的低速率语音编码方案,基于语音信号小波变换高频系数的稀疏性,利用压缩感知原理,将小波变换高频系数进行压缩感知投影成数据量大大减少的观测序列,然后对观测序列采用码激励线性预测技术进行编解码,根据解码后的观测序列,利用线性规划技术对小波变换高频系数进行重构,小波变换低频系数采用矢量量化技术编解码,并采用后置低通滤波器改善解码后小波高低频系数合成语音的听觉效果。该编码方案在低数码率(2.64~3.5 Kb/s)时得到的重构语音平均MOS分为3.0~3.4,达到4.8 Kb/s码激励线性预测语音编码质量。
- 叶蕾杨震郭海燕
- 关键词:小波变换压缩感知码激励线性预测矢量量化线性规划
- 基于多任务协同注意门控网络的含噪语音情感识别方法
- 本发明提供了一种基于多任务协同注意门控网络的含噪语音情感识别方法,通过将语音情感分类主任务与语音增强次任务相结合的多任务协同注意门控网络,提高了特征的鲁棒性,在噪声环境下获得了优异的情绪识别性能;针对语音情感分类主任务,...
- 孙林慧张子晓王静李平安叶蕾
- 基于过完备线性预测字典的压缩感知语音重构被引量:22
- 2012年
- 基于语音信号帧内样值间的相关性和冗余域的稀疏性,针对采用离散余弦转换矩阵及基追踪方法对压缩感知采样语音进行重构时,语音稀疏性不够好导致大压缩比采样后重构效果差的缺点,提出采用过完备线性预测字典做转换矩阵,用基追踪重构算法对压缩感知采样语音进行高质量重构。该方法预先由训练语音的预测系数聚类构造过完备字典,不需要测试语音的预测系数;基于过完备线性预测字典重构信号性能良好。对利用基追踪重构的语音进行了主客观评价,得出结论:同样的观测数目下,基于过完备线性预测字典比基于离散余弦变换矩阵压缩感知采样语音重构信噪比高出3~8 dB。
- 孙林慧杨震季云云叶蕾
- 关键词:压缩感知语音信号
- 基于多领域统计特征和改进CNN的含噪语音情感识别方法
- 本发明提出了一种基于多领域统计特征和改进CNN的含噪语音情感识别方法,属于语音识别领域,包括以下步骤:步骤1:首先对语料库中的纯净语音进行加噪处理,其次提取语音信号的相关多领域特征,采用统计函数对已提取的特征进行筛选,降...
- 孙林慧 王舜赵敏叶蕾
- 一种基于QoE的多模态码流模式选择与资源分配方法及系统
- 本发明公开了一种基于QoE的多模态码流模式选择与资源分配方法,该方法首先给出了视频、音频和触觉三个维度上反映用户体验的量化指标;然后将D2D通信与SVC编码、NOMA技术结合,针对不同场景下的多模态码流,设计对应的通信传...
- 魏昕杨镇宇黄蓉周亮索云飞叶蕾