分位数

ここでは、分位数とは何か、およびその計算方法について説明します。また、分位数の種類についても説明し、分位数の計算の解決例も示します。最後に、オンライン計算機を使用してデータ サンプルの任意の分位数を計算できるようになります。

分位数とは何ですか?

統計において、分位数は、順序付けされたデータのセットを均等に分割する点です。したがって、分位数は、データの割合がその下にある値を示します。

たとえば、0.39 次の分位値が 24 の場合、サンプル内のデータの 39% が 24 未満で、残りのデータが 24 より大きいことを意味します。

したがって、分位数は、分布からデータを等しいグループに分離するために使用されます。さらに、特定の値を上回るまたは下回るデータの割合を示すためにも使用されます。

👉以下の計算機を使用して、任意のデータセットの分位数を計算できます。

分位数の種類

分位数のさまざまな種類は次のとおりです。

  • 四分位数– データセットを 4 つの等しい部分に分割する分位数。したがって、第 1 四分位 (Q 1 )、第 2 四分位 (Q 2 )、および第 3 四分位 (Q 3 ) の 3 つの四分位が存在します。
  • 五分位数– データセットを 5 つの等しい部分に分割する分位数。したがって、サンプル内に存在できる五分位数は 4 つだけです。このタイプの分位数は文字 K で表されます。
  • Deciles : データセットを 10 等分する分位数。十分位数の記号は文字 D です。
  • パーセンタイル– データセットを 100 等分する分位数。パーセンタイルはサンプルのパーセンテージも示します。それらは文字 P によって名前が付けられます。

さまざまな種類の分位数を関連付けるプロパティの 1 つは、中央値、第 2 四分位数、第 5 十分位数、および第 50 百分位数が同じ値を持つことです。

さらに、他のタイプの分位数もありますが、これらはあまり使用されません。その中で、一連のデータを 3 つの同一の部分に分割するターシルと、収集されたデータを 20 の等価な部分に分割する自警団が際立っています。

同様に、すべてのタイプの分位点は非中心位置の測度とみなされます。

分位数の計算方法

統計データ セットの分位数の位置を計算するには、データの総数に 1 を加えた合計を分位数に乗算する必要があります。

したがって、分位数式は次のようになります。

p\cdot (n+1)

注意してください:この式は、分位数の値ではなく、分位数の位置を示します。分位点は、式で求めた位置にあるデータになります。

ただし、この式の結果から 10 進数が得られる場合があります。したがって、結果が 10 進数であるかどうかに応じて 2 つのケースを区別する必要があります。

  • 式の結果が小数部のない数値である場合、分位数は上記の式で指定された位置にあるデータです。
  • 式の結果が小数部を含む数値である場合、正確な分位値は次の式を使用して計算されます。

C=x_i+d\cdot (x_{i+1}-x_i)

ここで、x iおよびx i+1は、最初の式で得られた数値が挟まれる位置の番号であり、 dは、最初の式で得られた数値の小数部分です。

分位数の計算が非常に複雑だと思われる場合でも、心配する必要はありません。次の例を読むと、それが実際には簡単であることがわかります。

: 科学界では、分位数の計算方法についてまだ合意が得られていないため、少し異なる方法で説明している統計の本を見つけることができます。

分位数の計算例

分位数の定義とその計算理論を考慮して、特定の分位数の計算に関する解決済みの演習を以下に示します。これは、概念をよりよく理解するのに役立ちます。

  • 次の統計サンプルの次数 0.50 の分位数と次数 0.81 の分位数を計算します。

問題のあるデータはすでに昇順にソートされているため、変更する必要はありません。そうでなければ、最初にデータを整理する必要がありました。

上で説明したように、分位点の位置を見つけるための式は次のとおりです。

p\cdot (n+1)

この場合、サンプル サイズは 49 観測値であるため、0.50 分位数を計算するには、 n を49 に、 p を0.50 に置き換える必要があります。

0,5\cdot (49+1)=25\quad \color{orange}\bm{\longrightarrow}\color{black}\quad C_{0,50}=250

したがって、分位数 0.50 は、順序付きリストの 25 番目の位置にある値となり、値 250 に対応します。

ここで、同じ式を再度適用して、0.81 分位数を見つけます。論理的には、この 2 番目の例では、 p を0.81 に置き換える必要があります。

0,81\cdot (49+1)=40,5

ただし、今回は式 (40.5) から 10 進数を取得しました。これは、分位数が位置 40 と位置 41 の間にあることを意味します。 したがって、この分位数を決定するには、2 番目の方法式を使用する必要があります。

C=x_i+d\cdot (x_{i+1}-x_i)

この場合、分位数は位置 40 と 41 の間にあり、その値はそれぞれ 286 と 289 になります。したがって、 x i は286 の価値があり、 x i+1は 289 の価値があり、 dは取得された数値 i の小数部分、つまり 0.5 になります。

C_{0,81}=286+0,5\cdot (289-286)=287,5

ご覧のとおり、分位数の計算は、最初の式で 10 進数が得られるかどうかによって決まります。さらに多くの例を見たい場合は、ここでさまざまな種類の分位点に関するさらに多くの解決済み演習を参照できます。

分位数計算機

統計データセットと計算したい分位数を以下の計算機に入力します。数値はスペースで区切って、小数点としてピリオドを使用して入力する必要があります。

  • 分位値 =

グループ化されたデータの分位数

データが間隔にグループ化されている場合に分位数を計算するには、まず次の式を使用して、分位数が該当する間隔またはビンを見つける必要があります。

p\cdot (n+1)

したがって、分位数は、累積絶対頻度が前の式で得られた数よりもすぐに大きい区間内にあります。

分位数が属する区間がわかったら、次の式を適用して分位数の正確な値を見つける必要があります。

C=L_i+ \cfrac{p\cdot (n+1)-F_{i-1}}{f_i}\cdot I_i

金:

  • i は、分位点が存在する区間の下限である。
  • nは観測値の総数です。
  • F i-1は、前の間隔の累積絶対頻度です。
  • f iは、分位点が存在する区間の絶対周波数です。
  • I iは分位点間隔の幅です。

これを行う方法を示すために、グループ化されたデータに対して次数 0.29 と 0.62 の分位数を計算する具体的な例を次に示します。

0.29 分位数を計算するには、まずそれが存在する区間を見つける必要があります。これを行うには、次の式を使用します。

p\cdot (n+1)

0,29\cdot (500+1)=145,29 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [350,375)

したがって、分位点は、累積絶対頻度が 145.29 よりすぐ大きい区間内にあります。この場合、これは、累積絶対頻度が 175 である区間 [350.375) です。そして、分位点区間がわかったら、2 番目の公式を使用します。方法:

C=L_i+ \cfrac{p\cdot (n+1)-F_{i-1}}{f_i}\cdot I_i

C_{0,29}=350+ \cfrac{0,29\cdot (500+1)-131}{44}\cdot 25 =358,12

ここで、同じ手順を再度適用して、分位数 0.62 を取得します。まず、分位点の間隔を計算します。

0,62\cdot (500+1)=310,62 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [425,450)

累積絶対頻度が 310.62 よりすぐ大きい区間は [425.450) で、累積絶対頻度は 347 です。 したがって、プロセスの 2 番目の式を使用して正確な分位値を計算します。

C_{0,62}=425+ \cfrac{0,62\cdot (500+1)-298}{49}\cdot 25=431,44

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です