洪峰
- 作品数:32 被引量:7H指数:2
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信交通运输工程理学更多>>
- 一种用于海底底质识别的声学数据获取方法
- 本发明提供了一种用于海底底质识别的声学数据获取方法,包括步骤:S1:利用相控可变焦参量阵,通过不同距离、不同角度、不同发射参数对多种海底底质目标发射参量波;S2:利用双通道获取参量波的回波信号,并对接收的信号进行滤波处理...
- 洪峰冯海泓黄敏燕
- 文献传递
- 用于提升聋哑人语音表现力的语音合成技术
- 2024年
- 目前,聋哑人主要通过手语的方式与健听人进行沟通,但这对未接受专业手语学习的健听人来说是一种挑战。因此,将手语转换为文本,再将文本转换成带有聋哑人音色的、健听人能理解的语音非常具有研究意义。为研究聋哑人语音合成的可行性,文章首先分析了聋哑人的语音特征,并根据分析的结论,提出了能合成高自然度、高清晰度且带有聋哑人自身声音特色的模型算法以及相应的评估体系。文章根据不同残疾程度的聋哑人语音特征,提出了面向轻度残疾聋哑人的语音转换和合成方法以及面向重度残疾聋哑人的语音克隆方法。根据分析结果,轻度残疾聋哑人语音与健听人语音具有一定的共性,因此使用AdaIN-VC语音转换模型转换出带有聋哑人音色、高可懂度的语音,并将转换好的语音结合Tacotron2语音合成模型进行文本到语音的映射。考虑到重度残疾聋哑人语音的不稳定性,文章基于Zero-shot的SV2TTS语音克隆框架,使用了ECAPA-TDNN作为重度残疾聋哑人音色表征的说话人编码器,以获取准确的聋哑人表征。此外,文章还引入基于基频情感分类的风格迁移模块,对合成语音进行风格上的迁移。实验结果表明,在保证一定相似度的情况下,实验中两位轻残聋哑人的自然度主观意见评分别从原来的2.53和3.06提高至2.88和3.21,并且语音识别的错词率从100%分别降低至80.77%和76.91%。同样,文中提出的主观错词率也有明显的下降。而在语音克隆的实验中,模型合成的重残聋哑人语音与其自身音色的相似度主观相似度意见评分达到3,且聋哑人语音的自然度主观意见评分和情感表达能力均得到了提高。
- 马皓天洪峰毛海全郑立通牟宏宇许伟杰
- 关键词:语音合成语音转换
- 结合多尺度卷积网络和双端注意力机制的水声目标识别被引量:3
- 2023年
- 水声目标识别是被动声呐系统的主要应用之一。为了进一步提升小样本条件下水下目标的识别率,文章提出一种基于多尺度卷积和双端注意力机制相融合的方法。首先,提取梅尔倒谱系数,色度谱和计算谱对比度等特征,建立基于多类别特征子集的三维聚合特征。其次,采用多尺度卷积滤波器算子构造多分辨率卷积神经网络,以更好地适应三维聚合特征的时频结构。另外,采用双端注意力模型捕获样本的全局依赖和局部特性。采用基于指数加权的对数交叉熵函数作为损失函数,提升样本数较少类别的识别率。实验结果表明,该方法在ShipsEar数据上的平均识别率为95.5%,取得了较好的分类效果。
- 刘承伟洪峰冯海泓胡梦璐
- 关键词:水下目标识别
- 基于FPGA的智能存储控制系统及其应用
- 本发明涉及一种基于FPGA的智能存储控制系统,包括FLASH主控制器;FLASH命令形成器及带记忆功能的地址生成器,用于产生跨时钟域的电平信号并自动避免越界写入;配置数据形成器,用于由写配置驱动信号驱动控制配置写入功能;...
- 洪峰冯海泓黄敏燕
- 文献传递
- 一种基于声纹识别的门禁考勤系统、注册及识别方法
- 本发明公开了一种基于声纹识别的门禁考勤系统,主处理器和协处理器进行信号连接,协处理器主要负责检测、唤醒和提示,对外部进行感应并生成相应的感应信号,接收感应信号并进行唤醒判断,判断成功后向主处理器发送激活信号。存储模块和通...
- 洪峰许伟杰郑立通
- 一种用于未知水下水面的声学识别方法
- 本发明公开了一种用于未知水下水面的声学识别方法,获取带标签的已知识别目标作为源域数据集;获取未带标签的已知识别目标和未知识别目标作为目标域数据集;对源域数据集进行监督训练获取嵌入码提取模型,并对源域数据集计算平均嵌入码以...
- 洪峰
- 球面聚焦相控参量阵声探测装置
- 本发明涉及一种球面聚焦相控参量阵声探测装置,包括主控单元,用于完成系统参数设置、系统控制、回波数据存储和处理及结果显示;可编程电子舱,与所述的主控单元相连接,用于实现波形控制参数可调、系统远程控制及数据传输、发射信号相控...
- 冯海泓洪峰黄敏燕杨震亚李记龙
- 文献传递
- 基于迁移学习和基频特征融合的文本相关说话人识别框架
- 2024年
- 目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景中的数字串声纹识别研究,并提出一种基于迁移学习和基频特征融合的文本相关说话人识别框架,提高了文本相关说话人识别技术的可靠性。在数字串SHALCAS-WXSD22B-d006和SHALCAS-WXSD22B-d007语料实验中,所提框架实现的最佳等错误率分别为0.88%和1.05%,与ECAPA-TDNN基线模型相比等错误率相对降低了17和20个百分点,且达到了支付场景下的声纹识别安全性指标。实验结果表明,文中所提框架不仅具有更好的识别准确率和安全性能,而且同样能提高框架中包括ResNet34在内的其他log-Mel识别模型的性能。
- 马皓天洪峰毛海全徐楚林胡梦璐牟宏宇陈友元许伟杰
- 关键词:决策级融合
- 一种半监督学习的被动水声目标识别方法
- 本发明公开了一种半监督学习的被动水声目标识别方法,获取若干带标签的已知水声目标数据作为源域数据集,以及若干未带标签的未知目标数据作为目标域数据集。依次进行有监督预训练、半监督微调、伪标签生成与微调、监督分类训练以及无监督...
- 洪峰
- 基于COTS的人工耳蜗体外语音处理器设计与实现被引量:1
- 2009年
- 人工耳蜗是目前治疗深度或重度耳蜗性聋的唯一有效的办法,由体外语音处理器和植入体组成。介绍了一种基于商用现货原则(COTS,Commercial-Off-The-Shelf)的低功耗人工耳蜗体外语音处理器的设计与实现:系统选用低功耗立体声A/D芯片CS53L21实现前端处理和采集语音信号;利用通用16位定点DSP芯片TMS320VC5502实现语音处理CIS算法;借用RFID射频芯片MLX90121向植入体传输能量并与其进行双向数据通信。
- 洪峰孟丽李平
- 关键词:人工耳蜗低功耗