用語解説｜株式会社教育測定研究所（JIEM）

用語解説

（注1）集団依存(sample dependent)の問題

　古典的テスト理論に基づくテストが出す測定値である偏差値は、必ず受験集団のレベルの影響を受けます。すなわち、レベルの高い集団の中で出た“40”という偏差値と、レベルの低い集団の中で出た“70”という偏差値はどちらが高いと言えるのかという問題です。この場合この値はその母集団の影響によって、必ずしも一定の尺度上で解釈することはできないという欠点があります。

（注2）テスト項目依存（test dependent）の問題

　古典的テスト理論に基づくテストが出す測定値は、その実施されたテストの難易度にも影響を受けます。すなわち、レベルの高い問題が多い難しいテストで測った“40”という測定値と、レベルの低い問題が多い易しいテストで測った“70”という測定値はどちらが高いと言えるのかという問題です。この場合「測定値」はそのテスト項目の内容によっても、必ずしも一定の尺度上で解釈することはできないという欠点があります。

（注3）最新のテスト理論

　1次元尺度で個人の能力値を推定できる手法として、現在研究が進んでいるのが最新のテスト理論である「項目応答理論（IRT: Item Response Theory）」です。
　「項目応答理論」は、事前にサンプルテストを行うことで、試験問題の小問ごとに、「項目識別度」「項目難易度」「当て推量度」等の項目パラメータを付与し、個々人の回答結果によって受験者の「能力値」を推定していく理論で、この理論を援用することにより、受験者集団やテスト項目に依存しない能力値の推定が可能になります。

（注4）信頼性

　「信頼性」とは、測定値（テストの点数）が高い安定性を持っていることを指します。すなわち、同一人が同一のテストを受けたときに、常に一定の能力値を測ることができることを言います。

（注5）妥当性

　「妥当性」とは、そのテストが測ろうとしている能力をきちんと測っているかどうかという「構成概念の妥当性」や、目的としている能力をそのテストが正しく予測できるかどうかという「予測妥当性」などがあります。

（注6）パーソナルコンピュータの利用

　コンピュータ上で行う教育測定の進化については、4つの世代が考えられていますが、当社では特に第2世代のテストを「e-テスティング」と呼び、第1世代のコンピュータテストとは区別して考えています。
第1世代のコンピュータテストは、試験を一斉実施する必要がなく、いつでもどこでも試験を実施できる上に結果がすぐに出るというメリットがあります。さらに、第２世代のコンピュータ適応型テストは、「項目応答理論（IRT: Item Response Theory）」を利用することで、一定の「能力値」を従来テストよりも高い精度で測定することができるだけでなく、試験時間もペーパーテストより短い時間で判定できるというメリットがあります。