Qq プロットを使用して正規性を確認する方法
「分位数-分位数」の略であるQQ プロットは、データセットが理論的な分布に由来する可能性があるかどうかを評価するために使用されます。
ほとんどの場合、このタイプのプロットは、データ セットが正規分布に従うかどうかを判断するために使用されます。
データが正規分布している場合、QQ プロット上の点は直線の対角線上にあります。
逆に、グラフ上の点が直線の対角線から大きく外れると、データセットが正規分布に従う可能性が低くなります。
次の例は、R で QQ プロットを作成して正規性をチェックする方法を示しています。
例 1: 通常データの QQ プロット
次のコードは、200 個の観測値を含む正規分布データセットを生成し、R でそのデータセットの QQ プロットを作成する方法を示しています。
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create QQ plot qqnorm(data) qqline(data)
点は主に直線の対角線に沿って配置されていますが、各尾部に沿って若干のずれがあることがわかります。
このグラフに基づいて、このデータセットは正規分布していると安全に仮定できます。
例 2: 非正規データの QQ プロット
次のコードは、200 個の観測値を含む指数分布に従うデータ セットの QQ プロットを作成する方法を示しています。
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create QQ plot qqnorm(data) qqline(data)
点が対角線から大きくずれていることがわかります。これは、データセットが正規分布していないことを明確に示しています。
データが指数分布に従うように指定したことを考えると、これは当然のことです。
QQ プロットとヒストグラム
QQ プロットは、データセットが正規分布に従っているかどうかを視覚的に確認する方法であることに注意してください。
正規性を視覚的にチェックするもう 1 つの方法は、データ セットのヒストグラムを作成することです。データがヒストグラム内の釣鐘曲線の形状にほぼ従う場合、データ セットは正規分布していると仮定できます。
たとえば、以前に正規分布したデータ セットのヒストグラムを作成する方法は次のとおりです。
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create a histogram to visualize the distribution hist(data)
そして、指数関数的事前分布に従うデータセットのヒストグラムを作成する方法は次のとおりです。
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create a histogram to visualize the distribution hist(data)
ヒストグラムがまったく釣鐘曲線のように見えないことがわかります。これは、データが正規分布に従っていないことを明確に示しています。
追加リソース
統計における正規性の仮定とは何ですか?
R で QQ プロットを作成する方法
Excel で QQ プロットを作成する方法
Python で QQ プロットを作成する方法