外れ値とは、データセット内の他の値から異常に離れている観測値です。外れ値は分析結果に影響を与える可能性があるため、問題となる場合があります。 データセット内の外れ値を検出する一般的な方法は、四分位範囲を使用することです。 […]...
統計では、母集団パラメータ、つまり母集団全体の特定の特徴を表す数値の測定に関心が集まることがよくあります。 最も一般的な母集団パラメータは次の 2 つです。 1. 人口平均:人口内の変数の平均値 (たとえば、特定の都市の […]...
箱ひげ図は、データ セットの 5 桁の概要を表示するプロットの一種で、次のものが含まれます。 最小値 最初の四分位数 (25 パーセンタイル) 中央値 第 3 四分位数 (75 パーセンタイル) 最大値 箱ひげ図を作成す […]...
2 つのイベント A と B が与えられた場合、「A と B の確率を求める」とは、イベント A とイベント B の両方が発生する確率を求めることを意味します。 通常、この確率は次の 2 つの方法で記述されます。 P(A […]...
2 つの事象 A と B が与えられた場合、「A または B の確率を求める」とは、事象 A または事象 B が発生する確率を求めることを意味します。 通常、この確率は次の 2 つの方法で記述されます。 P(A または […]...
確率は、イベントが発生する可能性を示します。 たとえば、ある学校の全生徒の 4% が好きな科目として数学を好むとします。学生をランダムに選択した場合、その学生が数学を好む確率は 4% になります。 しかし、私たちは多くの […]...
確率は、イベントが発生する可能性を表します。 Excel では、次の構文を使用するPROB関数を使用して確率を計算できます。 PROB(x_range, prob_range, lower_limit, [upper_l […]...
レイリー分布は、ゼロ以上の値のみを取ることができる確率変数をモデル化するために使用される連続確率分布です。 次の確率密度関数があります。 f(x; σ) = (x/σ 2 )e -x 2 /(2σ 2 ) ここで、σ は […]...
一元配置分散分析は、説明変数の異なる水準が特定の応答変数で統計的に異なる結果をもたらすかどうかを判断するために使用されます。 たとえば、3 つの教育レベル (準学士号、学士号、修士号) が統計的に異なる年収につながるかど […]...
多段階サンプリングは、母集団をより小さなグループに分割し、結果として得られるより小さなグループ内の個人のサンプルを採取することによって母集団の サンプルを取得する方法です。 たとえば、米国の平均世帯収入を推定するとします […]...