北京市教委科技发展计划(KZ201210005007)
- 作品数:5 被引量:40H指数:3
- 相关作者:李玉鑑冷强奎张长水傅昆胡振更多>>
- 相关机构:北京工业大学清华大学更多>>
- 发文基金:北京市教委科技发展计划北京市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于深度学习的作曲家分类问题被引量:21
- 2014年
- 在音乐信息检索领域,作曲家分类是一个十分重要的问题,这一问题的目标是通过音频数据来识别相应的作曲家信息.传统的分类算法都是通过提取复杂的特征来进行分类的,而深层神经网络在特征学习上具有比较强的能力,因此提出用深层神经网络来解决这一问题.为了结合不同深层神经网络模型的优点,设计了一种混合模型,该模型基于深度置信网络(deep belief network,DBN)和级联去噪自编码器(stacked denoising autoencoder,SDA),可以较好地解决作曲家分类问题.实验表明,该模型取得了76.26%的正确率,这一结果比单纯用某一种模型搭建的深层神经网络以及支持向量机要好.和图像数据类似,人脑在提取音乐特征也是分层的,每一层对信号的处理不一样,因此混合模型在解决作曲家分类问题上具有一定的优势.
- 胡振傅昆张长水
- 关键词:混合模型
- 不平衡支持向量机的惩罚因子选择方法被引量:15
- 2011年
- 支持向量机在处理不平衡数据集时常常不能取得良好的效果,而基于不同惩罚因子的不平衡支持向量机能够较好地处理这个问题。阐述了支持向量机在不平衡数据集上失效的原因,讨论了不平衡支持向量机的求解算法,提出了一种根据数据集分布的平均密度直接选取惩罚因子的方法,以减少传统交叉验证方法选取参数所需的时间。实验表明,与其他方法相比,这种平均密度方法能够有效提高不平衡支持向量机在不平衡数据集上的识别效果。
- 金鑫李玉鑑
- 关键词:惩罚因子参数选取
- 组合凸线性感知器的极大切割构造方法
- 2014年
- 组合凸线性感知器(Multiconlitron)是用来构造分片线性分类器的一个通用理论框架,对于凸可分和叠可分情况,分别使用支持凸线性感知器算法(Support conlitron algorithm,SCA)和支持组合凸线性感知器算法(Support multiconlitron algorithm,SMA)将两类样本分开.本文在此基础上,提出了一种基于极大切割(Maximal cutting)的组合凸线性感知器构造方法.该方法由两阶段训练构成,第一阶段称为极大切割过程(Maximal cutting process,MCP),通过迭代不断寻求能够切开最多样本的线性边界,并因此来构造尽可能小的决策函数集,最大程度减少决策函数集中线性函数的数量,最终简化分类模型.第二阶段称为边界调整过程(Boundary adjusting process,BAP),对MCP得到的初始分类边界进行一个二次训练,调整边界到适当位置,以提高感知器的泛化能力.数值实验说明,此方法能够产生更为合理的分类模型,提高了感知器的性能.同其他典型分片线性分类器的性能对比,也说明了这种方法的有效性和竞争力.
- 冷强奎李玉鑑
- 关键词:泛化能力
- 基于LASVM-NC和TF.RF的文本分类方法被引量:1
- 2014年
- 非凸在线支持向量机(LASVM-NC)具有抗噪能力强和训练速度快的优点,而词频相关频率积(tf.rf)则是一种自适应能力很强、分类性能非常好的文本特征。通过把非凸在线支持向量机和词频相关频率积相结合,提出了一种新的文本分类方法,即LASVM-NC+tf.rf。实验结果表明,这种方法在LASVM-NC与多种其他特征的结合中性能是最好的,且与SVM+tf.rf相比,不仅所产生的分类器具有泛化能力更强、模型表达更稀疏的优点,而且在处理含噪声的数据时具有更好的鲁棒性,在处理大规模数据时具有快得多的训练速度。
- 李玉鑑李玉雄冷强奎
- 关键词:词频文本分类
- 基于最近邻子空间搜索的两类文本分类方法被引量:3
- 2015年
- 在文本分类中,最近邻搜索算法具有思想简单、准确率高等优点,但通常在分类过程中的计算量较大。为克服这一不足,提出了一种基于最近邻子空间搜索的两类文本分类方法。首先提取每一类样本向量组的特征子空间,并通过映射将子空间变换为高维空间中的点,然后把最近邻子空间搜索转化为最近邻搜索完成分类过程。在Reuters-21578数据集上的实验表明,该方法能够有效提高文本分类的性能,具有较高的准确率、召回率和F1值。
- 李玉鑑王影冷强奎
- 关键词:文本分类最近邻搜索