本公司的考试理念

START

该考试能否真正地测试出考生的能力?

实施考试是有目的的。但要达到测试的目的,并不是一件容易的事。

目的是为了测评考生的“目标达成度”,还是测评考生的“学习进展情况”,是为了了解在全体考生中“自己的相对位置”,还是分析全体考生的“趋势”。考试的目的是多种多样的。但是如果不能根据考试目的正确地设计考试内容,就无法正确地进行评估。

JIEM认真的思考如何正确地测评考生的能力,研发相应的测试技术并加以实践。

  • Think01
  • 次へ

偏差值并不一定代表能力。

大家所熟悉的偏差值经常被误用。这是因为“受到考生群体的影响”高水平的考生群体中的“40”分,实际上有可能要优于低水平的考生群体中的“70”分。

单凭偏差值是无法正确评估能力的

  • Think02
  • 次へ

合格者的水平每年不同吗?

影响因素除了考生群体外,还要考虑到考试本身的难度。例如“今年出题难,合格者少”,“这回考试简单的问题多,合格率高”。在确定了及格线的考试中,每次考试的试题难度不同是非常不合理的。这样会造成每年合格者的水平不同。

  • Think03
  • 次へ

考试的“信度”和“效度”。

“信度”是指同一考生在同一条件下反复参加同一考试,其考试结果基本相同,即“考试结果具有极高的稳定性。”

另外,即使考试的信度很高,如果没有测试出需要测试的能力,也是毫无意义的。“能够准确测试出需要测试的能力”,即为考试的“效度”

因此,在设计考试时需要排除来自考生群体及试题 的干扰,使考生即使反复参加同一考试也能获得相同的考试结果。并且能够准确测试出需要测试的能力

  • Think04
  • 次へ

考试的“等化”理念。

每次考试的试题不同,是为了防止考生只要学了该试题内容即可作出正确回答的情况发生。但是试题不同,能否单纯用分数来评估考生的能力呢?

实际上即使试题不相同,也可以通过设立“标准(尺度)”来排除不同试题的影响,正确的测试出考生的能力。这就是“考试的等化(Test Equating)”。

  • Think05
  • 次へ

项目反应理论(IRT)是实现考试等化的有效方法。

传统的考试 理论(直接得分方式,偏差值方式)无法排除来自考生群体 及 试题 难度的影响。这是由于 考试分数中同时包含“考生的能力”和“考试难度”两方面的要素 。而项目反应理论则把考试难 度和考生 的能力分开处理。例如,针对某一难度的试题,具有某一能力的考生的回答正确率为X%,以其为根据,利用概率论的算法来估算出考生的能力值。

此过程需要进行高度的统计处理,因此在日本的教育界里使用的实例还不多。但在国外,作为更加精确的测试方法已在TOEFL®等考试中得到广泛应用。

  • Think06
  • 次へ

基于项目反应理论(IRT)的计算机适应性考试(CAT)。

针对某一问题,如果能够估算出某一能力的考生正确回答该问题的概率。在这样的“标准”下,就可以像视力检查那样,答对时,出一道相对更难的问题;答错时,出一道相对简单的问题。

计算机可以根据考生的回答结果选择适合考生的下一道问题。因此,计算机适应性考试(CAT)能够在短时间内精确地测试出考生的能力。

  • Think07
  • 次へ

第三代计算机考试对学习过程提供协助。

第1代计算机考试将纸质考试单纯的转化为机考(直接得分方式,偏差值方式)。第2代计算机考试是基于上述的项目反应理论的计算机适应性考试。第3代计算机考试在以“儿童英检”等为代表的“连续测试型”考试的研究中获得了进一步的发展。其特点是不仅局限于以往的单纯考试,还对学习过程提供协助。

首先,将每个单元中需要掌握的所有知识点系统地制作出一张地图,即“完全掌握地图(mastery map)”。在测试中可以自动检测出未掌握的部分,通过对这部分进行复试或自学,使测试本身成为高效的学习工具。

JIEM基于CASEC-GTS,CASEC-WT等考试,正在进行研发第4代AI技术。

请点击查看

  • Think08
  • 次へ

将来,考试分数低不再是一件难以启齿的事。

在竞争升学和学历竞争的年代,考试是“选拔”和“相对评价”的工具。当然在选拔人材及判断是否合格的方面,考试发挥了重要的作用。不过,人们越来越开始关注能够“培养个人能力”和“改善教学”的考试。

这种考试目的在于通过正确评估考生的实际能力,帮助每个考生成长。

考试分数低并不是坏事,也不是难以启齿的事。通过考试正确地了解自身的弱点。也许在不久的将来,这种认识将成为一种普遍的价值观。

请点击查看

  • Think09
  • 初めへ

PAGE TOP