张敏灵 作品数:59 被引量:128 H指数:7 供职机构: 东南大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 教育部“新世纪优秀人才支持计划” 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
面向开集识别的稳健测试时适应方法 2024年 开集识别旨在研究测试阶段突现未见类别对于机器学习模型的挑战,以期学习模型既能分类已见类别又可识别/拒绝未见类别,是确保机器学习模型能够在开放世界中高效稳健部署的重要技术.既有开集识别技术通常假设已见类别的协变量分布在训练与测试阶段维持不变.然而在实际场景中,类别的协变量分布常不断变化.直接利用既有技术不再奏效,其性能甚至劣于基线方案.因此,亟需研究新型开集识别方法,使其能不断适应协变量分布偏移,以期模型在测试阶段既能稳健分类已见类别又可识别未见类别.将此新问题设置命名为开放世界适应问题(AOW),并提出了一种开放测试时适应方法(OTA).该方法基于无标注测试数据优化自适应熵损失与开集熵损失更新模型,维持对已见类的既有判别能力,同时增强了识别未见类的能力.大量实验分析表明,该方法在多组基准数据集、多组不同协变量偏移程度下均稳健地优于现有先进的开集识别方法. 周植 张丁楚 李宇峰 张敏灵关键词:图像识别 流数据 弱监督学习专题简介 2021年 在许多现实任务中,数据对象的标注过程成本很高,学习系统通常难以获得完全、具体、精确的强监督信息.近年来,面向监督信息不充分、不具体、不精确等场景的弱监督学习范式已成为机器学习的热点研究领域.SCIENCE CHINA Information Sciences组织出版"弱监督学习专题"(Special Focus on Weakly Supervised Learning),旨在报道弱监督学习算法与应用方面的前沿进展. 张敏灵 李宇峰关键词:数据对象 一种面向标记噪声的多标记分类方法 本发明公开了一种面向标记噪声的多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景,具体包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用ECOC编码对原始标记进行embeddi... 张敏灵 方军鹏多示例学习与多标记学习的研究 监督学习是机器学习领域研究得最多、应用最为广泛的一种学习框架。在该学习框架下,每个对象由单个示例表示并对应于单个概念标记。一股认为,基于传统监督学习框架描述的学习问题是没有歧义性的。然而,歧义性对象在真实世界的问题中随处... 张敏灵关键词:多示例学习 多标记学习 混合型多示例学习算法 多示例学习被认为足与是监督学习、非监督学习以及强化学习并列的第四类机器学习框架,是当前国际机器学习界的一个研究热点,结合多种学习范式的混合学习是另一研究热点。奉文利用混合学习技术来解决多示例学习问题,提出了五种混合型多示... 张敏灵 周志华关键词:多示例学习 文献传递 面向多维分类的监督式降维 2023年 与传统多类分类相比,多维分类中每个对象仍由一个示例(特征向量)表示,但同时与多个类别变量相关联,各类别变量基于异构类别空间刻画对象的语义.降维可以有效地缓解维度灾难并加速模型训练,已有多维分类研究均关注于设计性能更好的学习算法,尚未出现面向多维分类数据降维方面的工作.本文基于特征空间和语义空间的相关性,首次面向多维分类数据设计了一种名为SDeM的监督式线性降维方法.该方法使用Hilbert-Schmidt独立判据衡量两个空间的相关性,通过最大化投影特征空间与语义空间在该度量下的相关性确定投影矩阵.实验结果表明,相比于无监督式降维方法,SDeM所得降维特征更有利于多维分类方法取得更好的泛化性能. 贾彬彬 张敏灵关键词:降维 多示例学习的研究 多示例学习起源于对药物活性预测问题的研究,由于其具有独特的性质和广泛的适用性,目前被认为是与监督学习、非监督学习以及强化学习并列的一种新型机器学习框架。本文针对多示例学习领域有待解决的问题,做了三方面的工作。
... 张敏灵关键词:多示例学习 文献传递 一种面向歧义标注样本的分类方法 本发明公开了一种面向歧义标注样本的分类方法,适用于对标记集合中存在歧义的样本进行分类。该方法包括以下步骤:(1)用户从样本存储设备中选样本;(2)根据样本自身特性提取特征,并整理对应的标记集合;(3)采用标记成对比较方法... 张敏灵 吴璇文献传递 编者按 2020年 近年来,随着信息化技术与互联网的飞速发展,各行各业积累的数据资源急剧增长,大数据已成为国家层面的基础性战略资源,引起各国政府高度重视.例如,国务院于2015年8月印发了《促进大数据发展行动纲要》,美国政府于2016年5月发布了《联邦大数据研究与开发战略计划》,欧盟Horizon2020计划把大数据提高到国家安全战略层面.发展大数据分析理论与技术方法,是实现我国从数据大国向数据强国转变的重要基础,将对国计民生的诸多方面产生深远影响. 周志华 张敏灵关键词:信息化技术 数据资源 国家安全战略 美国政府 一种基于最大化间隔机制的含噪多标记分类方法 本发明提出了一种基于最大化间隔机制的含噪多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景。该方法包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)使用标记置信度来表示标记信息,为... 张敏灵 朱雅婷 杨浩