杨毅 作品数:27 被引量:74 H指数:5 供职机构: 北京科技大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 北京市自然科学基金 更多>> 相关领域: 电子电信 文化科学 自动化与计算机技术 交通运输工程 更多>>
基于子带频谱质心特征的高效音频指纹检索 被引量:5 2017年 关键音频检测是指从音频库中检索出查询样例,是音频检索的一种重要形式。该文针对传统关键音频检测方法在效率和鲁棒性上的不足分别在预处理、指纹提取以及检索部分进行了优化。在预处理阶段采用基于子带能量比的语音端点检测算法,并在窗函数选择和子带划分方法上进行了改善;在指纹提取阶段采用种子片段选取的方法,并将指纹提取方法改进为子带频谱质心法;在检索阶段通过设定命中次数门限以提高效率。实验结果表明:该文提出的改进系统在查全率、查准率以及抗噪能力提升的同时提高了检索效率,有效地提升了检索性能。 孙甲松 张菁芸 杨毅关键词:指纹提取 端点检测 基于NIST评测的说话人分类及定位技术研究 2011年 该文针对美国国家标准与技术研究院(NIST)的NIST评测,构建了一套多距离麦克风说话人分类及定位语音处理系统,针对NIST富标注评测中提出的说话人分类问题,提出改进的结合时延估计和聚类的说话人分类方法,在保证稳定性的前提下降低说话人分类的复杂度并提高准确率;提出一种新的相邻阵元间时延构造矩阵方程算法,可得到多个说话人的方向角。实验在标准会议环境下采集真实语音数据进行算法验证,说话人分类算法的正确率接近目前主要说话人分类系统的正确率,定位方向角误差在3°以内。实验结果说明,适当条件下多距离麦克风系统可作为合适的语音信号输入设备应用于多人多方会议环境。 杨毅 宋辉 刘加基于鲁棒波束形成的麦克风阵列系统 2008年 为了提高噪声消除的鲁棒性,传统的通用旁瓣消除器采用固定波束形成作为输出的系数约束自适应滤波器,采用CCAF的输出作为输入的标准约束自适应滤波器。此系统的跟踪性能随信号频率变化而改变,并且由于波束带宽的影响使得目标语音在低频发生畸变。采用优化波束形成方法来得到较宽的带宽,对输出进行后滤波处理来消除残余噪声。试验表明本方法可明显提高语音信噪比。 杨毅 余达太 宋辉 刘加关键词:麦克风阵列 波束形成 基于多路线性预测技术的时延估计 被引量:2 2011年 很多麦克风阵列时延估计算法在噪声和混响环境下性能都会下降。该文提出一种基于多路线性预测(multi-ple linear prediction,MLP)的时延估计算法。通过传递函数比估计来消除通道间传递函数的非对称性,提高信号相关程度;空间预测技术引入了阵列冗余信息,并以相关系数矩阵作为时延搜索的目标函数,提高时延估计的可靠性。实验结果显示了多路线性预测算法的估计准确率更高,性能更加稳健。与几种经典算法相比,在噪声和混响环境下MLP算法的估计正确率分别提高了5%和30%以上。 宋辉 杨毅 刘加关键词:麦克风阵列 时延估计 基于连通域单元和穿越算法的汉字切分 被引量:14 2004年 参考汉字的基本结构特征,以连通域单元为基本处理单元,根据各个连通域单元之间的位置关系对其进行合并。对合并后的结果中存在字符粘连的情况,采用一种改进的穿越算法,选取最佳切分位置对文本进行切分。实验结果表明,本算法对单行自由格式手写体汉字切分可取得较好的效果。 王琳琬 杨扬 颉斌 杨毅关键词:字符切分 手写体汉字 《语音信号处理》实验教学研究与实践 被引量:4 2012年 语音信号处理是实现人机交互和话音通信技术的基础,语音信号处理教学实验课程在国外著名大学的电子工程系中普遍开设。语音信号处理实验课是为适应当前人才培养需求,配合语音信号处理课程课堂教学而开设的。通过语音信号处理实验可以让学生深入掌握数字信号处理的基本方法、属于准平稳随机过程的语音信号的特点、语音通信中编码方法、话音质量评价方法、语言信息处理的基本方法、统计模式识别的基本原理等基础知识和应用方法,并增加对实际建模方法和算法编程能力及基本理论的应用能力。在培养学生的动手和分析解决问题能力的同时激发学生对相关领域的研究兴趣。本实验课对深入学习语音信号处理课程深入以及培养语音领域高层次人才具有重要意义。 杨毅 邓北星 马晓红关键词:语音信号处理 教学实验 基于媒体认知课程的人工智能人才培养方法探索 被引量:1 2018年 1背景
随着电子信息技术日新月异,电子信息教学领域也面临着全新的挑战,需要培养具有全方位视野和超强能力的新一代工程师及领导者。媒体与认知是清华大学电子信息学科在课程体系改革过程中提出的一门重要的必修课程。结合清华大学电子工程系在该领域研究的基础、优势和创新性成果,我们有针对性地将已有科研成果转化为教学内容. 杨毅 颜历 王生进 乔飞关键词:人脸表情 表情识别 卷积神经网络 基于空间声学特征的说话人分类算法 2013年 针对先验信息缺失情况下的说话人分类问题,可以采用提取基于多距离麦克风的空间声学特征的方法进行说话人分类.为了解决由于空间声学特征维数随麦克风个数的增加而迅速增长带来的计算代价问题,需要对其进行降维处理.用一种基于空间声学特征的优化鉴别式保局投影说话人分类方法,实现了在保留空间声学特征流型结构的同时降低计算代价的效果.实验在多距离麦克风语音会议数据集上进行验证,得到在大部分数据集上本方法的分类误差率(diarization error rate,DER)得分低于传统方法的结果.结果表明:本方法的说话人分类性能比传统方法有所提高. 杨毅 陈国顺 鲍长春麦克风阵列应用于鲁棒自适应噪声消除 2007年 提出一种应用于鲁棒自适应噪声消除的新结构,用优化波束形成方法取代GSC中的固定波束形成(Fixed Beamforming)以得到较宽的带宽;对GSC的输出进行后滤波处理消除残余噪声。 杨毅 余达太 宋辉 刘加关键词:麦克风阵列 波束形成 媒体认知实验教学理念与实践研究 2015年 媒体与认知实验课程是清华大学电子工程系在课程改革中提出的一门全新的核心必修课程。文章首先阐述该课程的特点,然后介绍基于英特尔Real Sense设备及微软Kinect设备开发的一套探索前沿型实验教学平台,分别说明基于手势识别的博弈游戏实验项目和基于姿势识别的组合拍照实验项目,指出通过这些前沿的基于交叉学科的智能感知技术和内容,学生可以掌握成为本领域高层次专业人才必需的各项基本技能和专业知识。 杨毅 徐淑正 乔飞 王靖淇 王生进关键词:智能感知 人机交互