北京市自然科学基金(4112009) 作品数:22 被引量:70 H指数:4 相关作者: 李玉鑑 冷强奎 张亚红 王梅 金鑫 更多>> 相关机构: 北京工业大学 更多>> 发文基金: 北京市自然科学基金 国家自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 化学工程 更多>>
使用SVM和二叉树结构的分片线性分类器 被引量:1 2015年 提出了一种支持向量机(support vector machine,SVM)和二叉树结构相结合的分片线性分类模型。在每一节点,使用带软间隔的线性SVM计算分类超平面,并统计局部错误率。如果局部错误率在预先设定的阈值之下,则构造可进行最终决策的叶子节点;否则,进行非叶子节点的递归构造。对比实验表明,该分类器具有一定的有效性,优于一些原有分片线性分类器,在部分数据集上甚至能够达到RBF核SVM的水平。 冷强奎 李玉鑑关键词:支持向量机 二叉树结构 泛化能力 基于权重学习的图像最大权对集匹配模型 被引量:1 2014年 在图匹配模型中权重的设置对匹配性能有很大影响,但直接计算的权重往往不符合匹配图像的实际情况。为此,参照二次分配问题的图匹配学习思想,给出一阶和二阶最大权对集模型的权重学习计算方法。一阶最大权对集模型直接采用图像特征点作为图的顶点,而二阶最大权对集模型则采用某些特征点之间的连接边作为顶点,2个模型都可以通过Kuhn-Munkras算法求解。一阶最大权对集模型在本质上等价于二次分配问题的线性情况。在CMU House数据库上的图像匹配实验结果表明,二阶最大权对集模型优于一阶最大权对集模型,且两者在学习计算时的性能也优于直接计算的情况。 李玉鑑 尹创业 阳勇关键词:图像匹配 DELAUNAY三角化 基于组合凸线性感知器的文本分类模型 2017年 针对文本分类问题,从分片线性学习的角度出发,提出了一种文本分类的组合凸线性感知器模型.首先,对文本样本集进行预处理,包括特征选择、特征项赋权等;然后,分别利用生长支持组合凸线性感知器算法(growing support multiconlitron algorithm,GSMA)和支持组合凸线性感知器算法(support multiconlitron algorithm,SMA)构造组合凸线性感知器,对样本集进行分类.该模型基于支持向量机的最大间隔思想,通过集成线性分类器,实现了对2类数据的划分,具有计算简单、适应能力强的优点.在标准文本数据集上的实验结果表明:该模型所构造的分类器具有良好的文本分类性能,与其他典型文本分类方法的对比也说明了该方法的有效性. 李玉鑑 王曼丽 刘兆英关键词:文本分类 基于费希尔信息度量的随机近邻嵌入算法 被引量:2 2016年 为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之间的距离;然后,从信息几何的观点出发,对t分布随机近邻嵌入(t-stochastic neighbor embedding,t-SNE)进行改进,实现了新算法.真实文本数据集上的二维嵌入和分类实验的结果表明:FIMSNE的性能在总体上优于t-SNE、费希尔信息非参数嵌入(Fisher information nonparametric embedding,FINE)和主成分分析(principal components analysis,PCA). 张亚红 李玉鑑关键词:文本分类 信息几何 三元变量间一维流形依赖关系的检测 2016年 最大信息系数(Maximum Information Coefficient,MIC)能够很好的检测成对变量间的线性和非线性依赖关系,但却不能直接用于检测三元变量间的相关关系.基于MIC的思想和全相关的概念,本文提出了一种直接检测三元变量间一维流形依赖关系的方法—最大全相关系数(Maximal Total Correlation Coefficient,MTCC).MTCC用落在[0,1]区间上的值来表明三元变量间一维流形依赖关系的强弱,其中0和1分别表示最弱和最强的依赖关系.使用MIC的计算策略,本文还提出了一种有效的动态规划方法来近似计算MTCC的值.仿真实验说明MTCC与非线性相关信息熵(Nonlinear Correlation Information Entropy,NCIE)相比具有更好的通用性和公平性,真实数据的分析验证了MTCC的实用性.最后,强调了其专用性. 李玉鑑 张亚红关键词:数据挖掘 四种人眼定位算法的比较分析(英文) 被引量:5 2013年 人脸检测在许多应用中有着很重要的作用,其中人眼作为人脸中最重要的特征之一,没有单一的人眼检测算法甚至是一个系列技术可以解决所有精确定位人眼问题。因此对四种不同的人眼定位算法进行比较试验,分别是基于多角度的模版匹配法,霍夫变换法,自适应边缘提取法,对称变换法,比较各自的优缺点以及适应使用的环境,以期于在不同的图像条件和外部环境下达到识别的最优效果。 徐菲 李玉鑑关键词:模版匹配 霍夫变换 图像分割的图论方法综述 被引量:22 2014年 图像分割是图像处理与计算机视觉领域的基本问题之一,其本身固有的不适定性是该领域研究的最大挑战。图像分割的图论方法充分利用图像的整体和局部特性,具有很大的灵活性,较高的计算效率及良好的分割特性,成为分割领域的一个新的研究热点。根据当前主要的几类基于图论的分割模型概括了图像分割图论方法的基本框架,包括图的映射和构造、分割准则及目标函数的设计及求解。系统综述了图像分割图论方法的每一类别的理论及研究进展。最后就图像分割图论方法中尚存的问题及未来的可能发展方向提出了见解。 王梅 李玉鑑 全笑梅关键词:图像分割 最小生成树 最短路径 随机游走 一种改进的随机游走图像分割算法 被引量:1 2013年 为克服传统以像素为单位的随机游走算法随着像素点增多,计算量大、复杂度高、分割速度大大减慢,且对彩色图像分割效果不理想的问题,提出一种改进的随机游走图像分割方法。首先,使用改进和优化后的分水岭算法对目标图像进行预分割,为防止分水岭算法过分割问题,结合使用非线性各向异性扩散方法和形态学处理方法进行处理;然后,将分水岭算法分割后形成的同质区域作为图的节点用于随机游走算法,通过用户标记种子区域,分割出感兴趣的目标物体;最后,给出传统随机游走分割方法与本文提出的分割方法的实验结果比较,并对它们进行分析和评价。 王梅 李玉鑑关键词:随机游走 各向异性扩散 形态学处理 不平衡支持向量机的惩罚因子选择方法 被引量:15 2011年 支持向量机在处理不平衡数据集时常常不能取得良好的效果,而基于不同惩罚因子的不平衡支持向量机能够较好地处理这个问题。阐述了支持向量机在不平衡数据集上失效的原因,讨论了不平衡支持向量机的求解算法,提出了一种根据数据集分布的平均密度直接选取惩罚因子的方法,以减少传统交叉验证方法选取参数所需的时间。实验表明,与其他方法相比,这种平均密度方法能够有效提高不平衡支持向量机在不平衡数据集上的识别效果。 金鑫 李玉鑑关键词:惩罚因子 参数选取 图像多阶特征对集的最优匹配模型 2013年 针对图像匹配问题,提出了一种图像多阶特征对集的最优匹配模型.图像的多阶特征主要是指一阶、二阶和三阶特征,分别由单个特征点、特征点之间的边或者连接特征点的三角形来定义.最优匹配模型是一个以图像多阶特征为顶点集的加权二分图,其优点是权重参数可以直接计算,并能采用Kuhn-Munkras算法求解最大权对集.实验结果表明,该模型具有很好的鲁棒性,对于视频序列图像和涂鸦图像,即使在存在较大缩放、旋转和仿射变换的情况下,也能获得比较精确的匹配结果,其准确度通常优于OpenCV中著名的Flann和BruteForce匹配算法. 李玉鑑 阳勇 尹创业关键词:图像匹配