您的位置: 专家智库 > >

吕剑涛

作品数:2 被引量:13H指数:2
供职机构:广东外语外贸大学更多>>
发文基金:教育部人文社会科学重点研究基地度重大研究项目更多>>
相关领域:语言文字更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇语言文字

主题

  • 2篇考试
  • 1篇等值
  • 1篇英语
  • 1篇英语试卷
  • 1篇试卷
  • 1篇评卷
  • 1篇口语
  • 1篇口语考试
  • 1篇RASCH模...
  • 1篇标准化考试

机构

  • 2篇广东外语外贸...

作者

  • 2篇吕剑涛
  • 2篇刘建达

传媒

  • 2篇现代外语

年份

  • 1篇2015
  • 1篇2012
2 条 记 录,以下是 1-2
排序方式:
Rasch模型等值多套英语试卷的可行性研究被引量:8
2012年
大规模考试常同时使用多套试卷。为保证考试的公平性与信效度,试卷之间的等值非常重要。本文使用Rasch模型等值10套设有锚题的英语试卷。等值的方法是:先将10套试卷通过NEAT(nonequivalent groups with an anchor test)(von Davier 2004)设计衔接起来,再通过卡方检验和mean/sigma转换法算出的A常数值剔除质量差的锚题,最后用保留的锚题确定等值函数(B常数值)。对Rasch模型的适用性检验表明,10套试卷的数据符合Rasch模型的假设。等值结果分析显示,衔接各试卷的锚题在统计意义上均有效,基于Rasch模型的等值结果能校正试卷间的难度差异,故用Rasch模型等值多套英语试卷是可行的。
刘建达吕剑涛
关键词:RASCH模型标准化考试
大规模计算机口试分析评分效果研究被引量:5
2015年
基于计算机的外语考试和评分越来越多,以往研究大都涉及基于纸笔评分效果,对基于计算机的主观题评分效果研究不多。本文从评分一致性和分数维度差异两方面研究了大规模计算机口试分析评分的效果。通过对比整体评分法发现,分析评分法的评卷员行为一致性较好。评卷员使用整体评分法时未能较好地根据表达内容的完整性打分,而且容易出现集中趋势。进行分析评分时,评卷员在内容和语言分项上一致性较差。在准确度方面,评卷员给低水平考生评分要比给高水平考生评分好。
刘建达吕剑涛
关键词:口语考试
共1页<1>
聚类工具0