郭翔宇
- 作品数:4 被引量:12H指数:1
- 供职机构:南京大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于不充分模态信息的半监督网页自动分类方法
- 本发明公开了一种基于不充分模态信息的半监督网页自动分类方法,基于加权协同训练算法,在训练分类器的过程中给数据分配不同的权值。本发明方法能够减少由于不充分模态特征引起的数据不一致性对分类过程所带来的影响,从而具有更好的分类...
- 王魏詹德川郭翔宇
- 文献传递
- 一种基于不充分模态信息的半监督网页自动分类方法
- 本发明公开了一种基于不充分模态信息的半监督网页自动分类方法,基于加权协同训练算法,在训练分类器的过程中给数据分配不同的权值。本发明方法能够减少由于不充分模态特征引起的数据不一致性对分类过程所带来的影响,从而具有更好的分类...
- 王魏詹德川郭翔宇
- 利用未标记数据的机器学习方法研究
- 机器学习需要有标记数据来训练模型进行预测,有标记数据的获取通常需要人工参与,因此价格非常昂贵。在很多实际应用中,未标记数据可以较为容易地大量获取,如何利用廉价的未标记数据一直以来都是机器学习领域中的研究热点。目前出现了两...
- 郭翔宇
- 关键词:半监督学习
- 一种改进的协同训练算法:Compatible Co-training被引量:11
- 2016年
- 半监督学习是机器学习近年来的热点研究方向,而协同训练(Co-training)则是半监督学习中的重要范式,它利用双视图训练两个分类器来互相标记样本以扩大训练集,以此借助未标记样本提升学习性能.在实际应用中,视图通常会受到属性退化和噪声的影响而变得不充分(即视图不能提供足够的信息来正确预测样本的标记).在不充分视图下,两个视图上的最优分类器变得不再兼容,一个视图中的分类器标记的样本可能不利于另一个视图学得最优分类器.针对这一问题,提出一种改进的协同训练算法Compatible Co-training,它记录学习过程中每个未标记样本被赋予的标记,通过比较更新后的分类器对样本预测的标记与其初始标记,动态地删除标记不一致的样本,从而除去不利于学得最优分类器的样本.实验结果显示出Compatible Co-training比协同训练具有更好的泛化能力和更快的收敛速度.
- 郭翔宇王魏
- 关键词:半监督学习