浙江省自然科学基金(Y104540)
- 作品数:2 被引量:23H指数:2
- 相关作者:裘正定谢纪刚更多>>
- 相关机构:北京交通大学更多>>
- 发文基金:浙江省自然科学基金北京市重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于自助法抽样分布的ROC分析被引量:2
- 2008年
- 对于两类分类问题,错误率描述了分类器在单一判决阈值下的推广性能。然而,当两类错分代价不相等时,人们往往需要了解分类器在不同判决阈值下的性能。ROC(receiver operating characteristics)分析提供了一种全面了解分类器性能的途径,但是由于实际样本个数有限,训练集和测试集的划分必然会影响ROC曲线的形状,从而导致ROC分析具有不确定性。针对Fisher线性判别,本文提出了一种基于自助法抽样分布的ROC曲线生成方法。具体如下:定义Fisher线性分类器对测试样本的判别值为统计量,由自助法分别得到Fisher线性分类器对两类测试样本判别值的两个抽样分布,在这两个抽样分布范围内连续地改变阈值即可得到ROC曲线。实验表明,与随机划分和10重交叉验证相比,由本文方法生成的ROC曲线形状更加稳定,并且相应ROC曲线下面积的置信区间更短,也即本文方法能产生更加精确的ROC分析。
- 谢纪刚裘正定
- 关键词:自助法抽样分布FISHER线性判别ROC曲线
- 非平衡数据集Fisher线性判别模型被引量:21
- 2006年
- 非平衡数据是指两类问题中正类样本与负类样本个数不相等,甚至相比悬殊.非平衡数据集会导致许多分类器的性能下降,这与分类器的构造原理有关.本文首先阐述了Fisher线性判别的分类机制,指出当两类样本的协方差矩阵不同时,样本不平衡会导致Fisher线性判别的性能下降.在此基础上,提出了一种加权Fisher线性判别(WFLD),以减小样本不平衡的影响.然后,从UCI中选择了8个非平衡数据集,并采用ROC曲线下面积作为评估指标进行比较,实验结果证明了WFLD模型的有效性.
- 谢纪刚裘正定
- 关键词:非平衡数据集FISHER线性判别