搜索到354篇“ 概率抽样“的相关文章
- 非概率抽样估计中先验信息的利用——基于贝叶斯模型估计视角
- 2024年
- 非概率样本的估计问题是近年来的研究热点,本文以调查中先验信息的利用作为切入点,在配额抽样下设置贝叶斯形式的超总体模型,使用样本信息与先验信息对总体目标变量进行加权估计,从而解决非概率样本的估计问题。通过对北京市医疗资源调查的实证研究,表明先验信息的准确性和权重的合理分配决定着贝叶斯估计的效果,在合理的模型设置下贝叶斯估计在大量重复抽样下具有更好的稳定性。
- 郝一炜刘晓宇金勇进
- 关键词:先验信息
- 成功概率抽样检验在器材批产中的应用分析
- 2024年
- 针对器材批产比例抽检方法随批量消耗大,且存在大批严、小批宽等问题。分析了抽样方案设计原理,阐述了在器材批检试验抽样检验方案应用,综合考虑检验水平、抽样类型与可接收质量水平,开展了抽样检验方案设计,分析了连续批次抽样检验的一次抽样方案设计和二次抽样方案设计,比较方案使用风险,并研究了放宽抽样的选择情况。
- 刘征宇汪海涛
- 关键词:抽检
- 基于单元间距离估计的不等概率抽样算法及应用被引量:2
- 2023年
- 现有大数据的不等概率抽样方法大多基于数据分布,泛化能力较差。为此,利用多层感知机、XGBoost和Kriging模型估计总体单元间的相对距离,提出针对海量数据的不等概率抽样算法。此类算法既不需要考虑总体的分布,又能够保证样本的代表性。实证分析结果表明,基于此算法抽取样本构建的模型与简单随机抽样方法相比,模型参数估计的均方误差更低,效果更稳定。
- 周楷贺李莉莉
- 关键词:代理模型
- 基于局部概率抽样的标签噪声过滤方法被引量:4
- 2021年
- 分类学习任务中,在获取数据的过程中会不可避免地产生噪声,特别是标签噪声的存在不仅使得学习模型更复杂,而且容易造成过拟合并导致分类器泛化能力的下降。标签噪声过滤算法虽然在一定程度上可以解决上述问题,但是仍然存在噪声识别能力较差、分类效果不够理想以及过滤效率低等问题。针对这些问题,提出一种基于标签置信度分布的局部概率抽样方法来进行标签噪声过滤。首先利用随机森林分类器对样本的标签进行投票,从而获取每个样本的标签置信度;然后根据标签置信度的大小,将样本划分为易识别样本和难识别样本;最后分别采用不同的过滤策略对样本进行过滤。实验结果表明,在标签噪声存在的情况下,所提方法在大多数案例上能够保持较高的噪声识别能力,并且在分类泛化性能上也具有明显优势。
- 张增辉姜高霞王文剑
- 关键词:噪声过滤
- 基于动态概率抽样的标签噪声过滤方法被引量:8
- 2021年
- 在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对这一问题,提出一种基于动态概率抽样(DPS)的标签噪声过滤方法,充分考虑各个数据集样本间的差异性,通过统计各个区间内置信度分布频率,分析各个区间内置信度分布信息熵的走势,确定合理阈值。在UCI经典数据集中选取了14个数据集,将所提方法与随机森林(RF)、HARF、MVF、局部概率抽样(LPS)等方法进行了对比实验。实验结果表明,所提出的方法在标签噪声识别和分类泛化上均展示出了较高的能力。
- 张增辉姜高霞王文剑
- 关键词:噪声过滤置信度
- 社会经济调查中不等概率抽样的R语言实现
- 2021年
- 社会经济调查是工商管理专业研究生培养计划中一个重要的教学环节,是学生运用在校学习的基本知识和基础理论,去研究和探讨实际问题的实践锻炼,是培养学生养成运用专业的眼光去观察经济现象的一个重要手段。社会经济调查的组织形式通常是等概率抽样,这也是相关专业的学生易于理解和掌握的抽样形式。然而在抽样单元规模相差很大的情形下,不等概率抽样要比等概率抽样更公平公正,其实现方式也要复杂得多。为此,可将R语言融入到不等概率抽样的教学之中,通过重点介绍R语言内置函数sample()的用法,向学生直观地展示不等概率抽样是如何实现的,并通过仿真案例验证该函数的有效性。
- 刘金叶黄恒振
- 关键词:抽样调查R语言仿真模拟课程教学
- 大数据背景下非概率抽样方法的应用研究
- 2021年
- 大数据以其多样性、高速、高价值等明显优势,深刻改变了人们的工作和生活方式。尤其是在“总体取代样本”的思维转变下,大数据是否更贴近事实,基于样本统计和预测分析的传统统计是否仍将处于主导地位,值得我们思考。本文将讨论这些问题,分析统计学在大数据时代的适用性。
- 孔祥瑞
- 关键词:大数据
- 一种基于多场景状态转移矩阵与条件概率抽样的光伏出力时间序列模拟方法
- 本发明公布了一种基于多场景状态转移矩阵与条件概率抽样的光伏出力时间序列模拟方法,本发明用于模拟生成考虑季节特性、日特性、天气特性和波动特性的光伏时序出力。本发明首先针对每月光伏出力序列,以FCM聚类作为内部优化,以DB(...
- 朱俊澎袁越江雪辰唐亮孙辰军王卓然
- 文献传递
- 非概率抽样网络调查统计推断问题研究
- 随着信息技术的发展,互联网在人们的生活及工作中得到了广泛应用和普及,抽样调查技术也从传统纸笔调查发展到以互联网为媒介的网络调查。当前,网络调查在利用抽样调查进行的科学研究中应用十分普遍,然而,以互联网为媒介的网络调查也有...
- 牛成英
- 关键词:网络调查统计推断参数估计
- 文献传递
- 基于Brewer设计的不放回不等概率抽样方法
- 2018年
- 文章通过将总体随机划分成n/2或(n+1)/2个组,在每组中按Brewer(1963)方法实施大小为2的严格按单元大小成比例不等概率抽样(πPS抽样),构造出总体总值的估计量,建立了相应的理论。通过数值比较发现给出的方法显著地改进了精度。
- 王智光闫在在张婷婷
- 关键词:辅助信息
相关作者
- 丁明

- 作品数:368被引量:9,414H指数:55
- 供职机构:合肥工业大学电气与自动化工程学院
- 研究主题:电力系统 可靠性 可靠性评估 风电场 分布式电源
- 赵文猛

- 作品数:13被引量:67H指数:5
- 供职机构:华南理工大学
- 研究主题:割平面 分散式 多区域电力系统 机组组合问题 机组组合
- 姜高霞

- 作品数:31被引量:72H指数:6
- 供职机构:山西大学计算机与信息技术学院
- 研究主题:标签 噪声过滤 噪声 离群点检测 函数型数据
- 孙秦

- 作品数:341被引量:1,211H指数:15
- 供职机构:西北工业大学
- 研究主题:复合材料 有限元 ANSYS 复合材料层合板 气动载荷
- 马侠

- 作品数:21被引量:119H指数:7
- 供职机构:中国社会科学院
- 研究主题:人口迁移 城镇人口 农村人口 城镇发展 城市人口