信頼性解析とは何ですか? (定義&例)


統計学において、信頼性という用語は測定の一貫性を指します。

知性、知識、生産性、効率などを測定するとします。何度も測定することはできません。個人の場合、測定値は一貫していますか?

理想的には、研究者はテストの信頼性が高いことを望んでいます。これは、長期間にわたって一貫した測定値が提供され、テスト結果が信頼できることを意味するためです。

信頼性を測定するには 4 つの方法があることがわかりました。

1.半分割信頼性法– 質問の言葉遣いが不十分であったり、指示が分かりにくいなど、テストの構成が不十分であることによるテスト結果のエラーの程度を判断します。

この方法では次のプロセスが使用されます。

  • テストを 2 つの部分に分割します。たとえば、半分は偶数の質問で構成され、もう半分は奇数の質問で構成されている場合があります。
  • それぞれの半分を同じ個人に投与します。
  • 大人数のグループに対してこれを繰り返します。
  • 前半と後半のスコア間の 相関関係を計算します。

2 つの部分間の相関が高いほど、テストまたは調査の内部一貫性が高くなります。理想的には、テストのすべての部分が測定対象に等しく寄与していることを示すため、半分間の相関が高くなることを望みます。

2. テスト-再テストの信頼性方法– 管理上の問題 – 例: 騒々しい環境、不十分な照明、テストを完了するための不十分な時間などによるテスト結果のエラーの程度を判断します。

この方法では次のプロセスが使用されます。

  • 個人のグループにテストを実施します。
  • 一定の時間 (数日、数週間、または数か月) 待ってから、同じグループの個人に同じ検査を実施します。
  • 2 つのテストのスコア間の相関関係を計算します。

一般に、テストと再テストの信頼性相関が少なくとも 0.80 以上であれば、信頼性が良好であることを示します。

3.並列形式の信頼性方法– 無関係な影響によるテスト結果の誤差の程度を判断します。たとえば、生徒が事前に質問にアクセスできたり、生徒がより高いスコアを獲得したりするだけで、より多くの得点につながります。

この方法では次のプロセスが使用されます。

  • 1 つのバージョンのテストを個人のグループに管理します。
  • 同じグループの個人に対して、同じように難しい別のバージョンのテストを実施します。
  • 2 つのテストのスコア間の相関関係を計算します。

4.評価者間信頼性方法– テストの各項目が測定対象の真の構成をどの程度一貫して測定するかを決定します。たとえば、すべての質問は明確に伝えられており、測定対象の構成に関連していますか?

この方法では、数人の訓練を受けた評価者または審査員がテストの各項目を評価し、評価者または審査員間の全体的な一致率を計算します。

審査員間の一致率が高いほど、テストの信頼性が高くなります。

信頼性と有効性

信頼性は測定の一貫性を指し、妥当性はテストまたはスケールが測定対象の構成をどの程度測定するかを指します。

優れたテストまたはスケールとは、高い信頼性と有効性の両方を備えたものです。ただし、テストやスケールが有効ではなくても信頼できる場合もあります。

たとえば、箱の重さを量る特定の秤の重さが、実際の重量より常に 10 ポンド重いとします。この秤は測定値が一貫しているため信頼できますが、真の重量値を測定していないため無効です。

測定の信頼性と標準誤差

信頼性係数を使用して、測定の標準誤差を計算することもできます。これは、繰り返し測定が行われた場合の個人の「真の」スコアの周囲の変動を推定します。

次のように計算されます。

SE m = s√ 1-R

金:

  • s:測定値の標準偏差
  • A:テストの信頼性係数

測定の標準誤差について詳しくは、こちらの記事をご覧ください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です