代表的なサンプルとは何ですか? それが重要な理由は何ですか?


統計では、特定の集団の特徴を研究することに関心が集まります。たとえば、次のような研究に興味があるかもしれません。

  • 特定の都市における機械エンジニアの全体的な仕事満足度。
  • 特定の郡の個人の政治的好み。
  • 特定の国における個人の年齢分布。
  • とある学校の生徒たちの映画的嗜好。

これらの各例では、特定の母集団をより深く理解したいと考えています。

母集団:研究したい個人のグループ全体。

残念ながら、集団内の各個人に関するデータを収集するには、コストと時間がかかる場合があります。研究者が通常、母集団のサンプルに関するデータを収集し、そのサンプルからの結果を母集団全体に一般化するのはこのためです。

サンプル:母集団のサブセット。

たとえば、総生徒数 1,000 人の特定の学校の生徒の映画の好みを把握したいとします。各学生を個別に調査するには時間がかかりすぎるため、代わりに 100 人の学生から無作為にサンプルを採取し、彼らの好みについて尋ねることができます。

1,000 人の学生が母集団を代表し、ランダムに選択された 100 人の学生がサンプルを代表します。 100 人の生徒のサンプルのデータを収集したら、これらの結果を 1,000 人の生徒の母集団全体に一般化できますが、これはサンプルが母集団を代表している場合に限ります

代表サンプル:個人の特徴が母集団全体の特徴とよく一致するサンプル。

理想的には、サンプルは母集団の「ミニバージョン」に似ていることが望ましいです。したがって、学生人口全体が女子 50%、男子 50% で構成されている場合、90% の男子と 10% の女子だけが含まれている場合、サンプルは代表的ではありません。

母集団を代表しないサンプルの例

または、母集団全体が 1 年生、2 年生、3 年生、4 年生で構成されている場合、1 年生だけが含まれているサンプルは代表的ではありません。

母集団を代表していないサンプル

代表的なサンプルを入手することの重要性

代表的なサンプルが必要な理由は、自信を持ってサンプルから母集団への結果を一般化できるようにするためです。

たとえば、ある学校の生徒の何パーセントが好きな映画のジャンルとして「ドラマ」を好むかを知りたいとします。生徒の総人口が男子 50%、女子 50% の混合である場合、好きなジャンルとして演劇を好む男子生徒が大幅に少ない場合、男子 90%、女子 10% からなるサンプルでは偏った結果が生じる可能性があります。

あるいは、総母集団が新入生、二年生、三年生、四年生の均等な混合である場合、若い学生(新入生など)が新入生よりも演劇を好む傾向がはるかに高い場合、新入生のみを含むサンプルでも偏った結果が生じる可能性があります。年長の生徒たち。

サンプル内の個人の特徴が母集団全体の個人の特徴と厳密に一致しない場合、サンプルからの結果を母集団全体に自信を持って一般化することはできません。

代表サンプルの入手方法

代表的なサンプルを入手できる可能性を最大限に高めるには、サンプルを入手するときに 2 つのことに焦点を当てる必要があります。

1. 適切なサンプリング方法を使用します。

母集団のサンプルを取得するにはさまざまな方法がありますが、代表的なサンプルを取得できる 3 つの方法を次に示します。

単純なランダム サンプル:乱数発生器またはランダム選択手段を使用して個人をランダムに選択します。

  • 例: 1,000 人の生徒に番号を割り当てます。次に、乱数発生器を使用して 100 個の乱数を選択し、対応する生徒をサンプル メンバーとして使用します。
  • 利点:単純な無作為サンプルは、各メンバーがサンプルに含まれる確率が等しいため、通常、対象となる母集団を代表します。

体系的なランダムサンプル:母集団の各メンバーを特定の順序で配置します。ランダムな開始点を選択し、サンプルの一部となるメンバーを n 人から1 人選択します。

  • 例: 1,000 人の生徒全員の姓に基づいてアルファベット順のリストを作成し、開始点をランダムに選択し、サンプルに含める生徒を 10 人ごとに選択します。
  • 利点:系統的無作為サンプルは、各メンバーがサンプルに含まれる確率が等しいため、一般に対象となる母集団を代表します。

層別ランダムサンプル:母集団をグループに分割します。各グループから数人のメンバーをサンプルの一部としてランダムに選択します。

  • 例:すべての学生をレベルに従って、1 年生、2 年生、3 年生、4 年生に分けます。各学年から 25 人の生徒をサンプルの一部としてランダムに選択します。
  • 利点:階層化されたランダム サンプルにより、各学年の同数の生徒がサンプルに含まれることが保証されます。

2. サンプルが十分な大きさであることを確認してください。

適切なサンプリング方法を使用することに加えて、サンプルが十分な大きさであることを確認して、より大きな母集団に一般化できる十分なデータを確保することが重要です。

たとえば、8 人の生徒 (各学年の男子 1 名と女子 1 名) のサンプルは、母集団全体の縮小版を表す可能性がありますが、おそらく、生徒の反応に自然に存在するすべてのばらつきを捉えるには十分な大きさではありません。 。

では、サンプルの大きさはどれくらいにすべきでしょうか?

それは次の要因によって異なります。

  • 母集団サイズ:一般に、母集団サイズが大きいほど、サンプルも大きくする必要があります。たとえば、結果を単一の都市ではなく国全体に一般化したい場合は、より大規模なサンプルが必要になります。
  • 信頼水準:関心のある母集団の真の値が信頼区間内にあることをどの程度確信したいか。一般的な信頼水準には 90%、95%、99% があります。信頼レベルが高いほど、サンプルのサイズも大きくする必要があります。
  • 誤差の範囲:許容できる間違いの数。完璧なサンプルは存在しないため、少なくともある程度の誤差は許容する必要があります。ほとんどの調査研究は、誤差の範囲内で結果を報告しています。たとえば、「学生の 40% は、演劇が好きな映画ジャンルであると答えましたが、誤差の範囲は +/- 5% です。」 » 誤差の範囲が低いほど、サンプルは小さくする必要があります。

これらの要素に基づいてサンプル サイズを決定するのに役立つサンプル サイズ計算ツールがオンラインで多数あります。 Survey Monkey のこの計算機は特に使いやすいです。

留意すべき事項

適切なサンプリング方法を使用し、サンプルが十分な大きさであることを確認した場合でも、次の点に留意してください。

  • サンプリング誤差は常に存在します。サンプルが母集団全体を完全に代表することは決してありません。
  • 一般に、サンプルが大きいほど、母集団をより代表するものになります。
  • サンプルサイズと、時間やコストなどの現実世界の変数のバランスを取る必要があります。サンプルが大きいほど母集団全体を代表している可能性が高くなりますが、サンプルを取得するにはコストと時間がかかる可能性があります。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です