熊巍
- 作品数:10 被引量:40H指数:4
- 供职机构:中国人民大学统计学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:理学经济管理社会学医药卫生更多>>
- 部分线性单指标模型稳健估计方法的研究与应用
- 熊巍
- 关键词:分位回归
- 重复测量诊断试验的ROC曲线广义线性混合效应模型被引量:17
- 2017年
- 目的针对重复测量诊断数据,为同时考虑协变量对诊断试验准确性评价的影响,度量重复测量数据间的相关性,本文探索新的ROC曲线的建模方法。方法通过广义线性混合效应模型对ROC曲线进行模拟,并采用贝叶斯参数估计方法,利用Win BUGS软件予以实现,进而计算不同协变量取值下的ROC曲线下面积(AUC)以对诊断试验结果进行评价。结果实例数据分析结果表明,基于广义线性混合效应模型的ROC曲线建模方法可以有效地刻画重复测量诊断试验数据,给出更有解释意义的回归参数,提供临床分析的参考依据。结论基于广义线性混合效应的ROC曲线模型在解决重复测量诊断试验的准确度评价问题起着至关重要的作用。
- 马春桃熊巍田茂再
- 关键词:ROC曲线贝叶斯
- 复杂数据分析理论方法及其在重大稀有疾病风险评估与预测中的应用
- 田茂再苏宇楠罗幼喜陈彦靓郭洁储昭霁封达道李兆媛司世景熊巍
- 项目所属科学技术领域:数理统计、经济金融以及生物统计等。该项目研究成果的主要内容与创新点:1.分层分位回归模拟:研究了几个热门话题,涉及时间序列中的分位回归;分位回归的拟合优度;贝叶斯分位回归,局部变化窗宽自动选择的自适...
- 关键词:
- 刻度函数的稳健估计方法
- 2014年
- 在对统计数据的建模和分析中,数据的波动性和扰动性是人们越来越关注的一个问题.于是如何对其进行有效地识别和刻画并精确地估计出来就变得尤为重要.文章考虑一个线性异方差模型,主要的目标是将未知的刻度函数稳健地恢复出来.在传统的刻度参数的估计中,四分位距是一个稳健的估计量.文章在此基础上进一步提出"极小四分位距"及"最优分位距"两个新的稳健估计量,欲将任意分布F中的刻度参数有效地估计出来.进而为了对异方差模型中的刻度函数进行估计,将该思想推广到条件分布中,并利用分位回归技术,这样刻度函数就得以稳健的恢复出来.值得说明的是在估计过程中无需知道均值函数的任何信息,使得该方法更具优势.此外文章研究了估计量的渐近性质并与传统的四分位距方法进行比较.结果表明,不论误差分布是对称的还是非对称的,所提出的估计量都有显著的优越性.最后,为了检测所提出估计量的性能,进行了一些模拟研究,得到的结果与理论是相符的.
- 熊巍田茂再
- 关键词:分位回归
- 北京市区域教育资源分配研究
- 2016年
- 北京市作为中国的政治文化中心,其教育发展问题更是各界关注的焦点.而区域教育的发展状况及区域教育的协调发展程度.不仅体现着一个地区的教育发展水平,也体现着一个社会全面、协调和可持续发展的程度.北京市教育科学十二五规划中也将北京市区域教育均衡发展和教育现代化建设列为重要内容.为考察北京市区域教育发展状况并对今后教育发展趋势给出合理化建议,采用多元统计分析方法对北京市16个区县基础教育资源分配进行研究.首先使用脸谱图直观展示多维数据指标,其次利用因子分析综合评价各地区基础教育资源分配,最后通过聚类分析将北京市区县按基础教育资源状况分成三大类,并绘制教育发展状况地图,直观展示地理分布特点.总体来看北京市教育资源在人均数量上并没有偏重教育发展程度高的市区,反映了北京市区域教育均衡发展的方针.并针对北京市区县教育发展状况因地制宜提出合理化建议.
- 王佳熊巍田茂再
- 关键词:区域教育聚类分析
- 复杂高维时空大数据探测器的统计理论与方法
- 田茂再郭洁张圆圆苏宇楠田玉柱熊巍周健吴延科晏振胡亚南
- 该成果属于统计学及交叉学科的前沿研究领域,开展多元高维复杂数据分析、建模、算法与仿真等基础科学问题的原创性研究,内容包括EQ-算法、统计反问题中的耦合定理以及高维复杂时空大数据探测器的研发等,这些研究被誉为当今统计学科研...
- 关键词:
- 最优分位水平及其衍生应用被引量:1
- 2019年
- 分位数回归方法由于其具有稳健性,不仅能够全面刻画响应变量的条件分布,还能提供更有现实意义的回归参数,已经逐渐成为各个领域统计分析的强有力的工具.但在许多实际应用中,人们不仅想要探寻不同水平下(即不同分位数)响应变量与解释变量之间的关系,更希望找到一个最优水平,也即最优分位数,使其上的回归结果最真实可靠,最好地反映总体情况.文中提出一种新的回归方法一最优分位回归方法,给出此类问题一个完美的解决方案.该方法的灵感主要来源于稀疏函数的定义,可以证实与传统均值回归相比最优分位回归方法更具优势:(1)稳健性.不受误差分布的限制;(2)有效性.回归结果蕴含信息更丰富;(3)灵活性.对任意模型及数据均适用.文中的模拟结果也对以上三条性质给予极大的支持.最后食品消费数据的分析结果表明当考虑食品消费与人均收入的关系时,中下等收入人群的消费模式为社会的主流模式.
- 熊巍熊巍
- 关键词:分位数回归稳健性
- 基于矩阵分解的最近邻推荐系统及其应用被引量:12
- 2019年
- 网络和电子商务的发展,促进了推荐系统的应用。最近邻推荐算法有很直观的解释而在推荐系统中发挥着巨大作用。随着海量数据的可获得性,传统的推荐算法在推荐系统中表现不佳。矩阵分解作为一种新的推荐算法极大地提高了稀疏评分矩阵的推荐质量。文章将矩阵分解的结果应用于基于用户的最近邻推荐系统,其优势在于充分考虑了用户与项目及用户之间的联系。将该方法应用于书籍评分数据,提高了预测精度且能对结果作出很好的解释。
- 王娟熊巍
- 关键词:推荐系统矩阵分解个性化推荐
- 大数据下Leverage重要性抽样方法的稳健改进被引量:6
- 2016年
- 大数据以其巨大的样本容量或超高的变量维度使得直接计算变得不再可能,如何有效地抽取一个合适的计算样本是值得思考的问题。本文借鉴Leverage重要性抽样的思想,提出了两种稳健的改进抽样算法,不仅有效地抽取了代表性高的计算样本进行回归估计,还规避了方差大和异质性导致协方差矩阵估计不准的问题。模拟数据的分析显示,相比于Ma(2015)的方法,本文提出的方法具有更为优良的估计结果。
- 秦磊熊巍田茂再
- 关键词:大数据协方差矩阵
- 可加模型的无交叉分位回归曲线与房价问题研究被引量:4
- 2015年
- 高维数据分析是当前研究的热点话题,而在对其进行分析时,非参数方法由于其灵活,无需对模型进行假定,得到了广泛的发展和认可。其中可加模型不仅能够有效地对变量进行降维,避免"维数灾难"的发生;而且能够得到各个变量的边际效应,具有很好的解释性。为了得到更加稳健的估计量,本文考虑利用分位回归方法对可加模型进行估计。分位回归方法由于其能够全面地刻画因变量在各个分位点上的变化趋势,并不受误差分布的限制,使得该方法具有更广泛的应用性。本文综合考虑以上优势,提出局部线性最小化检验函数估计方法和局部线性双核估计方法对可加模型进行估计。并且该方法能够有效地避免可加模型分位回归曲线的交叉问题.蒙特卡洛结果显示,与传统的均值估计法相比,不论误差分布的形式,我们提出的方法更具有优越性。用北京市二手房房价数据进行实证分析,进一步验证了本文提出的估计方法。
- 何静熊巍田茂再
- 关键词:可加模型