位置測定

この記事では、位置測定とは何か、またその使用目的について説明します。したがって、すべての位置測定値と各タイプの例が見つかります。

位置測定とは何ですか?

位置は、一連のデータを定義するのに役立つ測定統計パラメータです。簡単に言えば、位置測定はデータセットがどのようなものかを知るのに役立ちます。

統計学では、位置測定には 2 種類あります。データセットの中心値を決定するために使用される中心位置測定と、データを等間隔に分割するために使用される非中心位置測定です。 。

位置測定とは何ですか?

統計における位置測定は次のとおりです。

  • 中心位置測定: 分布の中心値を示します。
    • 平均: これは、サンプル内のすべてのデータの平均です。
    • Median : これは、最小値から最大値の順に並べられたすべてのデータの中央の値です。
    • モード: これは、データセット内で最も繰り返される値です。
  • 非中心位置の測定: データセットを等しい部分に分割します。
    • 四分位数: データ サンプルを 4 つの同一の部分に分割します。
    • 五分位数: データを 5 つの等しい部分に分割します。
    • Deciles : データセットを等しい大きさの 10 個の間隔に分割します。
    • パーセンタイル: データを 100 の等価な部分に分割します。

それぞれのタイプの位置測定については、以下でさらに詳しく説明します。

中心位置の測定

中心位置の測定値は、分布の中心値を示します。つまり、データセットの中心を表す値を見つけるために使用されます。中心位置には主に、平均値、中央値、最頻値の 3 つの尺度があります。

半分

平均を計算するには、すべての値を加算し、観測値の合計数で割ります。したがって、平均の式は次のようになります。

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^N x_i}{N}

平均は、算術平均または平均とも呼ばれます。さらに、統計分布の平均は、その数学的期待値と等価です。

中央値

中央値は、すべてのデータを最小値から最大値の順に並べた中央の値です。言い換えれば、中央値は順序付けされたデータセットを 2 つの等しい部分に分割します。

中央値の計算は、データの総数が偶数か奇数かによって異なります。

  • データの総数が奇数の場合、中央値はデータの中央に位置する値になります。つまり、ソートされたデータの位置 (n+1)/2 にある値です。
  • Me=x_{\frac{n+1}{2}

  • データ ポイントの合計数が偶数の場合、中央値は中央に位置する 2 つのデータ ポイントの平均になります。つまり、順序付けされたデータの位置 n/2 および n/2+1 で見つかる値の算術平均です。
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

n

はサンプル内のデータの総数、 Meは中央値です。

ファッション

統計では、最頻値はデータ セット内で絶対頻度が最も高い値、つまり、データ セット内で最も多く出現する値です。

したがって、統計データ セットの最頻値を計算するには、サンプル内で各データ項目が出現する回数をカウントするだけでよく、最も多く繰り返されたデータ項目が最頻値となります。

モードは、統計モードまたは最頻値とも言えます。

最も繰り返される値の数に応じて、次の 3 種類のモードを区別できます。

  • ユニモーダル モード: 最大繰り返し回数の値は 1 つだけです。たとえば、[1、4、2、4、5、3]。
  • バイモーダル モード: 最大繰り返し回数は 2 つの異なる値で発生し、両方の値が同じ回数繰り返されます。たとえば、[2、6、7、2、3、6、9]。
  • マルチモーダル モード: 3 つ以上の値が同じ最大繰り返し回数を持ちます。たとえば、[3、3、4、1、3、4、2、1、4、5、2、1]。

非中心位置の測定

非中心位置の測定は、統計データセットを等間隔に分割するために使用されます。非中心位置の尺度には主に、四分位数、五分位数、十分位数、百分位数の 4 種類があります。

四分位数

統計において、四分位とは、データセットを 4 つの等しい部分に分割する 3 つの値です。したがって、第 1 四分位、第 2 四分位、および第 3 四分位は、それぞれ、すべての統計データの 25%、50%、および 75% を表します。

四分位は大文字の Q と四分位インデックスで表されるため、最初の四分位は Q 1 、2 番目の四分位は Q 2 、3 番目の四分位は Q 3になります。

五分位数

五分位数は、順序付けされたデータ セットを 5 つの等しい部分に分割する 4 つの値です。したがって、第 1、第 2、第 3、および第 4 の五分位は、それぞれサンプル データの 20%、40%、60%、および 80% を表します。

たとえば、第 3 五分位は収集された全データの 60% 以上を占めますが、残りのデータよりも小さいです。

五分位の記号は、五分位インデックスが付いた大文字 K です。つまり、第 1 五分位は K 1 、第 2 五分位は K 2 、第 3 五分位は K 3 、第 4 五分位は K 4です。ただし、文字 Q で表すこともできます (四分位数との混乱を招くため、お勧めしません)。

十分位数

十分位数とは、順序付けされたデータのセットを 10 等分する 9 つの値です。したがって、第 1、第 2、第 3、…十分位数は、サンプルまたは母集団の 10%、20%、30%、…を表します。

たとえば、4 番目の十分位値はデータの 40% よりも高くなりますが、残りのデータよりは低くなります。

一般に、十分位数は大文字 D と十分位数インデックスで表されます。つまり、最初の十分位数は D 1 、2 番目の十分位数は D 2 、3 番目の十分位数は D 3などとなります。

パーセンタイル

パーセンタイルは、順序付けされたデータのセットを 100 等分する値です。したがって、パーセンタイルは、データセットのパーセンテージが下回る値を示します。

たとえば、35 パーセンタイル値は、観測データの 35% よりも高くなりますが、残りのデータよりは低くなります。

パーセンタイルは大文字 P とパーセンタイル インデックスで表されます。つまり、1 番目のパーセンタイルは P 1 、40 番目のパーセンタイルは P 40 、79 番目のパーセンタイルは P 79などとなります。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です