您的位置: 专家智库 > >

李晓飞

作品数:8 被引量:35H指数:2
供职机构:北京大学深圳研究生院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划深圳市科技计划项目更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 4篇专利
  • 2篇期刊文章
  • 2篇会议论文

领域

  • 2篇电子电信
  • 2篇自动化与计算...

主题

  • 2篇噪声
  • 2篇噪声数据
  • 2篇声音识别
  • 2篇识别方法
  • 2篇说话人
  • 2篇录制
  • 2篇困倦
  • 2篇混合模型
  • 2篇饥饿
  • 2篇贡献度
  • 2篇MFCC
  • 1篇当前环境
  • 1篇信号
  • 1篇信息处理
  • 1篇信息融合
  • 1篇性别
  • 1篇性别识别
  • 1篇音段
  • 1篇音频
  • 1篇语音

机构

  • 8篇北京大学

作者

  • 8篇李晓飞
  • 8篇刘宏
  • 2篇付卓
  • 2篇庞程
  • 2篇王一

传媒

  • 1篇华中科技大学...
  • 1篇智能系统学报
  • 1篇第十届中国智...

年份

  • 1篇2016
  • 1篇2015
  • 4篇2013
  • 1篇2012
  • 1篇2009
8 条 记 录,以下是 1-8
排序方式:
一种基于改进的并行模型组合的声音事件识别方法
本发明涉及一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:1)录制声音事件的数据,根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;2)在室内真实有噪声的环境下获取当前环境中的噪声数据,根据噪声...
刘宏王一李晓飞
文献传递
一种实时的婴儿啼哭声识别方法
本发明涉及一种实时的婴儿啼哭声识别方法,其步骤包括:1)录制婴儿啼哭声信号并建立声音库,进行预处理;2)当啼哭声开始时,采集得到婴儿啼哭声后采样得到实时数字信号,并在固定时间窗内对实时数字信号中的完整语音段依次进行分帧、...
刘宏李晓飞付卓
文献传递
一种面向智能交互机器人听觉系统的语音命令词表筛选方法
致力于一种面向智能交互机器人听觉系统的语音命令词表筛选方法的研究.首先本文分析了传统鲁棒性DTW模板训练法的缺陷,提出一科改进的鲁棒性模板训练法;其次本文提出了一种采用总体均值和方差信息相结合的方法,来解决不同说话人的语...
李晓飞杨雪松刘宏
关键词:SPEECHSPEAKER-INDEPENDENTVOCABULARY
基于MFCC与基频特征贡献度识别说话人性别被引量:8
2013年
提出了一种复杂场景下基于MFCC与基频特征贡献度的说话人性别识别方法.该方法有效融合了基于Mel频率倒谱系数的模板匹配方法和基音频率判别方法.实验语音数据库包括5 000个孤立词语音和1 260个带情感的语音.在安静环境下说话人的性别识别率可以达到98.88%,在信噪比为10dB的babble噪声下通过谱减法降噪后的识别率为90.2%.实验表明:说话人情绪对性别识别的影响较大,尤其是男声.
庞程李晓飞刘宏
关键词:信息融合
一种基于改进的并行模型组合的声音事件识别方法
本发明涉及一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:1)录制声音事件的数据,根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;2)在室内真实有噪声的环境下获取当前环境中的噪声数据,根据噪声...
刘宏王一李晓飞
一种实时的婴儿啼哭声识别方法
本发明涉及一种实时的婴儿啼哭声识别方法,其步骤包括:1)录制婴儿啼哭声信号并建立声音库,进行预处理;2)当啼哭声开始时,采集得到婴儿啼哭声后采样得到实时数字信号,并在固定时间窗内对实时数字信号中的完整语音段依次进行分帧、...
刘宏李晓飞付卓
文献传递
机器人听觉声源定位研究综述被引量:27
2012年
声源定位技术定位出外界声源相对于机器人的方向和位置,机器人听觉声源定位系统可以极大地提高机器人与外界交互的能力.总结和分析面向机器人听觉的声源定位技术对智能机器人技术的发展有着重要的意义.首先总结了面向机器人听觉的声源定位系统的特点,综述了机器人听觉声源定位的关键技术,包括到达时间差、可控波束形成、高分辨率谱估计、双耳听觉、主动听觉和视听融合技术.其次对麦克风阵列模型进行了分类,比较了基于三维麦克风阵列、二维麦克风阵列和双耳的7个典型系统的性能.最后总结了机器人听觉声源定位系统的应用,并分析了存在的问题和未来的发展趋势.
李晓飞刘宏
关键词:机器人机器人听觉声源定位麦克风阵列
基于MFCC与基频特征贡献度识别说话人性别
提出了一种复杂场景下基于MFCC与基频特征贡献度的说话人性别识别方法.该方法有效融合了基于Mel频率倒谱系数的模板匹配方法和基音频率判别方法.实验语音数据库包括5 000个孤立词语音和1 260个带情感的语音.在安静环境...
庞程李晓飞刘宏
关键词:说话人信息处理精度控制
文献传递
共1页<1>
聚类工具0