您的位置: 专家智库 > >

王星

作品数:1 被引量:3H指数:1
供职机构:湖北大学计算机与信息工程学院更多>>
发文基金:武汉市青年科技晨光计划国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇训练数据
  • 1篇数据选择

机构

  • 1篇湖北大学

作者

  • 1篇曾诚
  • 1篇何鹏
  • 1篇陈丹
  • 1篇王星

传媒

  • 1篇计算机应用

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
跨项目缺陷预测中训练数据选择方法被引量:3
2016年
跨项目缺陷预测(CPDP)利用来自其他项目的缺陷数据预测目标项目的缺陷情况,为解决以往缺陷预测方法面临的训练数据受限问题提供了一个新的视角。训练数据的质量将直接影响跨项目缺陷预测模型的性能,因此,需尽可能选择与目标项目更相似的数据用于模型的训练。利用PROMISE提供的34个公开数据集,从训练数据选择方面,分析了四种典型的相似性度量方法对跨项目预测结果的影响以及各种方法之间的差异。研究结果表明:使用不同的相似性度量方法选出的训练数据质量不同,其中余弦相似性与相关系数两种方法效果更好,且最大改进比例达到6.7%;同时,根据目标项目的缺陷率,发现余弦相似性更适合于缺陷率高于0.25的项目。
王星何鹏陈丹曾诚
关键词:数据选择
共1页<1>
聚类工具0