夏利宇
- 作品数:6 被引量:22H指数:3
- 供职机构:中国人民大学统计学院应用统计科学研究中心更多>>
- 发文基金:教育部人文社会科学重点研究基地度重大研究项目国家社会科学基金更多>>
- 相关领域:经济管理理学更多>>
- 信用评级模型的数据离散化研究被引量:3
- 2019年
- 连续变量离散化属于信用评级建模的初始阶段,科学的离散化操作能够提升模型的分类效果和参数的稳定性,便于评级模型的产品呈现.考虑信用评级的误判成本差异,对类别-属性一致性最大化准则进行类别权重调整,提出ACACM准则,并提出基于ACACM准则的数据离散化算法.ACACM算法调整原算法中不同类别个体的权重,更加倾向于刻画误判成本较高的违约客户,使离散化后的变量能够提升评级模型的风险控制能力,更适合信用评级建模.
- 夏利宇夏利宇何晓群
- 关键词:信用评级模型客户分类
- 基于半参数方法进行拒绝推断的信用评级模型被引量:9
- 2018年
- 拒绝推断可视为因变量非随机缺失问题的特例,它处理信用评级建模中由于被拒客户的信用表现未知,样本偏差导致的参数估计有偏问题。本文基于Kim和Yu 2011年提出的非随机缺失下均值泛函的半参数估计模型,提出处理拒绝推断的迭代半参数法。运用此方法在5类缺失情形下进行模拟研究,并对Australian数据和中国某银行的征信数据进行实证研究。结果表明,与常用方法相比,迭代半参数法可以有效地识别被拒绝申请者中的"坏"客户,降低金融机构的违约风险,是一种相对保守的方法。
- 夏利宇夏利宇
- 关键词:信用评级模型
- 信用评级模型的特征选择方法研究被引量:4
- 2020年
- 特征选择是信用评级建模的重要环节,合理的特征选择能够简化模型结构和提升分类效果.借鉴w-L1SVM模型的加权思想,借助Logistic-Group-Lasso模型筛选组变量的优势,提出处理信用评级特征选择问题的加权Logistic-GroupLasso(w-LGL)模型,该模型在选择变量时更加关注误判成本较高的违约客户,且能够实现分类变量的整组处理.与常规特征选择方法相比,w-LGL模型在数值模拟与实证研究中的分类效果更好.
- 夏利宇夏利宇刘赛可
- 关键词:信用评级模型
- 基于半参数估计的非随机缺失样本分类
- 2018年
- 因变量非随机缺失是指样本中因变量的缺失机制与其自身特征高度相关,由于样本缺失具有选择性而不再适合推断总体特征。文章借鉴非随机缺失数据均值泛函估计的思想,运用基于指数倾斜的半参数模型解决非随机缺失样本的二分类问题,结合8类因变量缺失情形进行数值模拟研究,将半参数模型对非随机缺失样本的分类效果与Logit模型、SVM模型、决策树模型进行比较,实证结果表明,半参数方法的分类效果具有明显优势。
- 夏利宇王蕾刘赛可
- 关键词:半参数
- 基于收缩近邻方法的征信缺失数据插补研究被引量:5
- 2017年
- 在海量征信数据的背景下,为降低缺失数据插补的计算成本,提出收缩近邻插补方法.收缩近邻方法通过三阶段完成数据插补,第一阶段基于样本和变量的缺失比例计算入样概率,通过不等概抽样完成数据的收缩,第二阶段基于样本间距离,选取与缺失样本近邻的样本组成训练集,第三阶段建立随机森林模型进行迭代插补.利用Australian数据集和中国各银行数据集进行模拟研究,结果表明在确保一定插补精度的情况下,收缩近邻方法较大程度减少了计算量.
- 夏利宇何晓群
- 关键词:征信数据
- 基于正交迭代的有监督的稀疏主成分分析被引量:2
- 2018年
- 主成分分析是经典的无监督的数据处理工具,近年来关于稀疏主成分和有监督的主成分研究受到较多关注。基于正交迭代和距离相关系数,提出一种有监督的稀疏主成分分析方法 SSPCA,该方法考虑了自变量与因变量之间的相关性,并在迭代求解的过程中将一些与因变量Y相关性很弱的自变量对应的系数变为0,使所求的特征向量只保留预测能力较强的自变量信息;在数值模拟与实例分析中,相比其他四种方法,SSPCA方法均能取得较好效果。
- 王蕾李因果夏利宇