国家自然科学基金(31100756) 作品数:19 被引量:141 H指数:7 相关作者: 涂冬波 蔡艳 戴海琦 丁树良 刘铁川 更多>> 相关机构: 江西师范大学 赣南医学院 南昌大学 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 教育部人文社会科学研究基金 更多>> 相关领域: 哲学宗教 自动化与计算机技术 理学 文化科学 更多>>
基于属性层级关系的rRUM模型优化--模型解释力及判准率的提升视角 被引量:1 2016年 以提高认知诊断模型判准率及对数据的解释力为视角,对当前应用较广泛的r RUM模型进行优化(优化后的模型简记为r RUM-AH),并采用Monte Carlo模拟研究及实证研究相结合的范式,比较分析了传统的r RUM模型和r RUM-AH模型的诊断正确率及诊断结果的解释力.研究结果表明:当属性间存在层级关系时,不论在何种实验设计条件下,优化后的r RUM-AH模型属性诊断正确率远远高于传统的r RUM模型;当属性间存在层级关系时,r RUM模型的模式判准率平均不到80%(而r RUM-AH模型平均高达90%以上),难于满足实际需求,此时实际应用者选用该研究新开发的模型是一个较好的选择. 蔡艳 涂冬波关键词:认知诊断模型 认知诊断模型-资料拟合检验统计量及其性能 被引量:5 2014年 本文将IRT常用资料-模型拟合检验统计量χ2和G2引入认知诊断领域,具体讨论了这两个统计量在认知诊断资料-模型拟合检验的可行性及其侦查效果,为研究者及实际应用者在认知诊断资料模型拟合检验中提供借鉴及方法学支持。 涂冬波 张心 蔡艳 戴海琦兼顾测验效率和题库使用率的CD-CAT选题策略 被引量:14 2014年 CD–CAT中已有选题策略较注重测验效率,而对题库使用率不够重视。针对此问题,基于DINA模型,引入两种新的选题策略KLED和RHA,同时对HA进行模拟研究。结果显示:PWKL与KLED只在测验效率上具有优势;KLED若按属性向量分层,题库使用率有所提高,KLED比ED更容易推广到其他有显式表达的诊断模型场合;HA、RHA和RP–PWKL可较好兼顾测验效度和题库使用率,但RP-PWKL需设置项目的最大曝光率阈值。两种新选题方法在定长和变长CD-CAT都具有一定的应用价值。 汪文义 丁树良 宋丽红一种广义的认知诊断Q矩阵修正新方法 被引量:4 2019年 本文提出了一种新的Q矩阵修正方法--两阶段法(two-stage method),该方法不仅适用于简化的认知诊断模型,也适合于饱和的认知诊断模型,在实践应用中更具灵活性。模拟研究和实证研究表明:第一,两阶段方法整体上优于国际上知名的ζ2法(de la Torre&Chiu, 2016);第二,两阶段方法受被试人数和Q矩阵的错误率影响较小,尤其在小样本时仍有相对理想的正确率;第三,实证数据研究表明,两阶段法修正后的Q矩阵与数据拟合更好。 汪大勋 高旭亮 蔡艳 涂冬波关键词:Q矩阵 似然比 多级评分的认知诊断计算机化适应测验 被引量:21 2016年 本文在0-1评分的CD-CAT基础上,拓展出了适合多级评分CD-CAT(ps CD-CAT)的认知诊断模型及选题策略,为实现多级评分CD-CAT提供了方法支持。Monte Carlo模拟实验结果表明:本文拓展的多级评分CD-CAT具有较理想的属性诊断正确率及测验效率和题库安全性,可以用于多级评分数据的CD-CAT;模拟实验还表明,整体来看PS-PWKL和PS-HKL两种选题策略具有较高属性判准率、题库安全性和高测验效率,且均优于PS-KL选题策略。总之,本研究对于进一步拓展CD-CAT在实践中的应用提供了认知诊断模型与选题策略等。 蔡艳 苗莹 涂冬波基于属性多级化的认知诊断计算机化自适应测验设计与实现 被引量:13 2015年 本研究在传统CD-CAT的基础上进行拓展,开发设计了可以处理属性多级化的CD-CAT(记为p CD-CAT),而且当测验所有属性的水平数Lk=2时则p CD-CAT可简化为CD-CAT,因此传统CD-CAT是本研究设计开发p CD-CAT的一个特例。Monte Carlo模拟实验结果表明:基于属性多级化框架下设计的p CD-CAT具有较好的诊断正确率、题库安全性和较高的测验效率,弥补了传统CD-CAT不足;当属性多级化时,若采用传统CD-CAT方法,则诊断正确率很不理想(属性模式判准不到30%),表明传统CD-CAT在属性多级化测验情景时不适宜,而本文设计的p CD-CAT是一种不错的选择(属性模式判准高达80%以上)。总之,本研究对于进一步拓展CD-CAT在实践中的应用提供了新方法和新技术支持。 涂冬波 蔡艳认知诊断测验Q矩阵估计方法比较 被引量:2 2015年 认知诊断以微观认知角度对被试做出准确评估与反馈的优势在心理与教育测量领域展现出巨大发展潜力,但要利用这种优势就必须确保Q矩阵的合理性。研究表明错误界定的Q矩阵会严重影响模型参数估计和被试分类准确性。本文从参数化与否出发介绍6种基于被试作答反应的Q矩阵估计方法的基本思想、实现步骤及应用情况,总结这些方法的特点并展望未来研究方向,为认知诊断研究及应用提供借鉴和基础。 刘永 涂冬波关键词:Q矩阵 基于潜在类别分析的6~15岁儿童平衡秤任务认知规则探索 被引量:1 2013年 本研究使用自编平衡秤测验测试468名6~15岁儿童,通过潜在类别分析对认知规则进行分类。结果发现,被试使用了重量规则、重量规则、重量距离规则、补偿规则、力矩规则、距离优势规则等六种规则;6~9岁儿童主要使用重量规则;10~13岁儿童主要使用补偿规则;14岁以上儿童主要使用力矩规则;13岁到14岁之间是掌握力矩规则的关键时期。与规则评估技术相比,潜在类别分析用于认知规则研究具有明显优势,最后对运用此方法的前提假设与局限进行了讨论。 赵玉 戴海琦 刘铁川关键词:解题策略 我国一大型考试等值的铆题参数漂移检验 2012年 设置铆题来链接不同测验形式是一种常用的等值设计。但受到曝光等因素影响,铆题功能在不同施测时间会发生改变。本研究采用MH检验和logistic回归考察我国一大型考试等值的铆题质量,结果发现,有22个铆题发生参数漂移,铆题的难度参数和区分度参数可能发生漂移;这些铆题中大部分在二次使用时无法通过模型拟合检验;若不删除参数发生漂移的铆题导致较大的系统等值误差,应将铆题参数漂移检验作为等值中的一步必要工作。 刘铁川 戴海琦 赵玉关键词:项目功能差异 几种常用非补偿型认知诊断模型的比较与选用:基于属性层级关系的考量 被引量:21 2013年 当前国际上开发了60多种认知诊断计量模型(Fu&Li,2007),各种模型各具特点,实际应用者应根据实际情况选用恰当的模型。本研究以属性层级关系为切入点,采用MonteCarlo模拟的研究方法,比较了属性层级关系正确及有误两种情况下,当前国际上常用的五种认知诊断模型的性能,以充分考察不同认知诊断模型对属性层级关系的依赖程度,及属性层级关系的错误界定对各认知诊断模型诊断正确率的影响,从而为实际运用者在认知诊断模型选用上提供借鉴和参考。 涂冬波 蔡艳 戴海琦关键词:认知诊断模型