曾平飞 作品数:43 被引量:121 H指数:8 供职机构: 浙江师范大学教师教育学院 更多>> 发文基金: 教育部人文社会科学研究基金 浙江省自然科学基金 浙江省教育厅科研计划 更多>> 相关领域: 哲学宗教 文化科学 自动化与计算机技术 理学 更多>>
真有探究发生吗——也谈试题探究点的定位 被引量:3 2011年 中考中出现了一类新试题:探究题。学生做这类试题的过程中,真有探究发生吗?这个问题不好回答,可是几位研究生与导师,还是进行了探讨。 赵光平 曾平飞 罗星凯关键词:试题 探究题 中考 导师 数学问题提出能力的类别特征:基于潜剖面的分析 2022年 在已有测评框架的基础上,建构了测评指标的评分标准,通过应用多元概化理论验证了评分标准的可信度,进一步将其应用于小学生数学问题提出能力的实践调查中,通过潜剖面分析考察了小学生数学问题提出能力的现状及类别特征.研究结果表明:1)小学生在数学问题提出能力测评指标的3个子维度上的协方差分量较大,这说明用问题3个特征的得分来确定学生的数学问题提出能力的水平结果比较一致;2)测评工具全域总分的合成概化系数为0.9904,相对误差比较小,这说明评分者一致性程度较高,评分标准设置合理;3)潜剖面分析的拟合指数与分类验证结果表明,小学生数学问题提出能力可划分为差异明显的3类;4)问题提出能力不同类型的小学生在数学成绩上的差异明显. 洪清玉 康春花 曾平飞关键词:测评工具 一种混合计分的非参数认知诊断方法:曼哈顿距离判别法 被引量:12 2019年 研究提出了一种简洁的适于混合计分的非参数认知诊断方法—曼哈顿距离判别法(MDD),将HDD纳入MDD框架,通过模拟和实证研究考察了MDD的适宜性,结果表明:(1)MDD简单易解,适于混合计分情境,0-1计分时,HDD是MDD的一个特例;(2)MDD的判准率较高,三种判别方法 R_MDD、B_MDD和W_MDD差异极小;(3)MDD具有非参数方法不受知识状态影响、对样本容量无依赖,与属性个数关系不大等特点;(4)MDD在实践中的应用效果较好,为CDA走向实践、走向课堂提供了可能。 康春花 杨亚坤 曾平飞关键词:非参数方法 课堂评估 应大胆质疑,但需小心求证——由一道中考试题引发的问题和思考 2005年 在教学和考试中使用联系实际的素材,其价值已越来越被广大教师认同.然而,在把联系实际的理念转化为实践的过程中,会引发不少值得深思的问题.2004年武汉市使用的一道联系实际的中考物理试题给了我们一个很好的例证. 曾平飞 刘小兵 罗星凯关键词:物理试题 中考 素材 考试 建构反应题中能力估计准确性的影响因素:评分者人数和项目个数的交互作用 被引量:1 2018年 采用康春花、孙小坚和曾平飞(2016)提出的等级反应多水平侧面模型探讨了评分者人数和项目个数对被试能力估计准确性的影响。模拟研究的结果表明:(1)随着项目个数的增加,估计值与真值之间的相关也不断增加;(2)评分者人数和项目个数在平均绝对偏差(MAB)和误差均方根(RMSE)上的主效应均显著,两者间的交互效应也显著;(3)简单效应分析发现,当项目较少时,3个评分者条件下的能力估计准确性最好;随着项目个数的增加,4个评分者的估计误差迅速下降,且表现变为最好。 孙小坚 康春花 曾平飞 辛涛基于大规模学业水平测试的科学学习困难学生特点分析 被引量:1 2012年 本研究利用大规模学业水平测试数据,分析8年级学生科学学习困难的基本特点。研究发现:女生的科学学习困难发生率高于男生;学习困难的女生的科学成绩略高于男生;多数学生的科学学习困难会在生物、物理、地理等多个学科领域同时发生;科学学习困难学生内容和认知各个维度上的成绩是与正常学生的差距大致相同,他们对科学问题的回答倾向于基于经验和直觉,并表现出科学能力低下的特点。 曾平飞 罗星凯 赵光平 辛涛关键词:性别差异 乡村振兴背景下农村学校规模与学生学业表现关系的实证研究 被引量:1 2023年 基于浙江省某县某农村学区参加2022年中考的学生数据以及学校规模等信息,以七年级上期末考试成绩为学习起点,中考成绩为后测成绩,采用成长百分等级模型计算每位学生在在各门学科和总分的增值。运用相关性、方差分析、线性回归等方法,分析了中考成绩分别与学科起点和学科增值的关系。在此基础上,进一步比较了不同规模学校的中考成绩和学科增值的差异,以及不同规模学校对不同学生群体发展的影响。研究发现,学科起点与学科增值几乎可以完全预测中考成绩;虽然中大规模学校中考成绩优于小规模学校,但小规模学校对成绩增值的贡献均高于中大规模学校。可见,应从增值的角度肯定农村小规模学校的办学业绩,发现和认可小规模农村学校在乡村振兴中的价值与贡献。 曾善鹏 曾善鹏 苏胜 曾平飞关键词:农村义务教育 学科成绩 认知诊断十年:基于CiteSpace的知识图谱分析 被引量:1 2020年 借助CiteSpace可视化软件,对Web of Science数据库中认知诊断研究近十年的成果进行知识图谱分析。结果发现:(1)认知诊断研究覆盖国家较少,美国为核心国家,中国不断逼近核心地位;(2)跨国际机构合作较为薄弱,有待加强;(3)认知诊断知识基础包括认知诊断模型、Q矩阵校准和模型-数据拟合等方面,CDCAT研究在2013年后迅速增加;(4)研究理论较多,应用研究缺乏,应不断提升认知诊断在教学、考试中的价值,助力智慧教育的实现。 刘芯伶 康春花 曾平飞关键词:CITESPACE 教学考试 智慧教育 层级一致性指标的多级评分拓展 被引量:3 2018年 在认知诊断评估实践中,属性层级合理性的验证非常重要,而现有指标仅停留在0-1计分测验,无法适应考试形式和评分方式多样化的实践需求。研究将0-1计分层级一致性指标(MHCI)拓展至多级计分的层级一致性指标(GHCI),模拟和实证研究结果表明:(1)GHCI具有和MHCI相同的本质含义,考虑了父项目和子项目得分的多种可能性,从而将MHCI纳入GHCI体系;(2)在多级或混合计分情境,MHCI会有信息损失,容易发生低估,且易受转换比例的影响;(3)GHCI在模拟和实践情境均具较好的适宜性,拟合截断值的设置可依属性层级而定。 康春花 吴会云 孙小坚 曾平飞中日高中物理教材难度及其要素分析 被引量:1 2022年 利用教材难度模型,对中日两套有代表性的高中物理教材进行分析比较,结果发现中国人教版教材整体难度小于日本东书版教材,可比深度是造成两套教材难度不同的主要因素,力学、热学和电学是两套教材难度差异的主体部分,人教版教材的难度设计更具合理性。 李维涛 曾平飞关键词:高中物理教材 教材难度