中国科学院重点实验室基金(KGZD-EW-103-2)
- 作品数:4 被引量:14H指数:3
- 相关作者:颜永红彭飞邓浩江刘磊曾学文更多>>
- 相关机构:中国科学院中国科学院大学江西理工大学更多>>
- 发文基金:中国科学院重点实验室基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 音子配列学语种识别系统中特征选择方法的研究被引量:1
- 2013年
- 将信息增益和加权log似然比特征选择方法应用于音子配列学语种识别系统中进行特征降维。在美国国家标准技术研究院2009年语种识别评测数据集上进行实验,分别使用信息增益和加权log似然比准则以及传统的互信息,X^2统计量方法对数量巨大的N-gram进行特征选择,从中选出最具有鉴别性的部分组成特征向量,并用分类器进行分类。结果显示,当根据信息增益和加权log似然比准则选取一定数量的特征时,系统性能与使用全部特征的基线系统相比略好;当选取的特征数量很少时,信息增益和加权log似然比方法的性能要优于传统的互信息和X^2统计量方法。实验表明,在音子配列学语种识别系统中,信息增益和加权log似然比方法均可以有效地去除冗余信息,降低特征向量的维数,并且能使系统性能得到一定的提高。
- 梁春燕杨琳汪俊杰张建平颜永红
- 关键词:语种识别信息增益N-GRAM
- 基于语音识别与特征的无监督语音模式提取被引量:4
- 2014年
- 在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。
- 张震赵庆卫颜永红
- 关键词:语音识别
- 基于隐马尔可夫模型的非监督噪声功率谱估计被引量:4
- 2015年
- 噪声功率谱估计是语音增强算法的基本组成部分,传统算法大多采用启发式的估计方法,因而不能保证噪声估计值的统计最优。提出了一种基于极大似然的非监督噪声功率谱估计方法,采用隐马尔可夫模型(Hidden Markov model,HMM)在每个子带建立语音和非语音对数功率谱的统计模型,模型包含语音和非语音两个高斯分量,其中非语音高斯分量的均值表示噪声功率谱估计值,根据最大期望(Expectation maximization,EM)算法得到包括噪声均值在内的HMM参数集。针对语音信号可能出现的长时缺失,对HMM引入了一些约束条件,保证了模型的稳定性。实验表明,该方法获得的极大似然噪声估计优于基于启发式的经典方法获得的噪声估计。
- 许春冬战鸽应冬文李军锋颜永红
- 关键词:语音增强隐马尔可夫模型
- 基于特征子集的推荐系统托攻击无监督检测被引量:5
- 2014年
- 针对现有基于协同过滤的推荐系统易受托攻击影响的问题,提出一种基于特征子集的推荐系统托攻击无监督检测算法。利用现有攻击模型在项目选择上的随机性,给出一种描述用户兴趣集中程度的特征属性:兴趣峰度系数。将该系数与已有的推荐系统用户特征属性结合作为备选特征集,采用无监督特征选择方法为不同类型托攻击选取相应的检测特征子集。根据选择出的特征子集计算每个用户的离群度,以此进行排序并确定攻击目标,在已排序的用户序列上设置滑动窗口,通过计算窗口内攻击目标的平均评分偏移值对攻击用户进行过滤。实验结果证明,兴趣峰度系数的信息增益高于已有的特征属性,基于特征子集的无监督检测算法相比于现有的无监督检测方法具有更高的稳定性和精准度。
- 彭飞曾学文邓浩江刘磊
- 关键词:推荐系统特征子集