Jak utworzyć wykres qq w sas
Wykres QQ, skrót od „kwantyl-kwantyl”, służy do oceny, czy zbiór danych potencjalnie pochodzi z rozkładu teoretycznego.
W większości przypadków ten typ wykresu służy do określenia, czy zbiór danych ma rozkład normalny.
Jeśli dane mają rozkład normalny, punkty na wykresie QQ będą leżeć na prostej ukośnej.
I odwrotnie, im bardziej punkty na wykresie odbiegają od prostej linii ukośnej, tym mniejsze jest prawdopodobieństwo, że zbiór danych będzie miał rozkład normalny.
Najłatwiejszym sposobem utworzenia wykresu QQ w SAS-ie jest użycie instrukcji PROC UNIVARIATE z instrukcją QQPLOT :
proc univariate data =my_data noprint ; qqplot my_variable; run ;
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Uwaga : Używamy instrukcji NOPRINT do usuwania wszystkich innych podsumowujących statystyk i tabel automatycznie generowanych przez instrukcję PROC UNIVARIATE .
Przykład 1: Utwórz wykres QQ w SAS-ie dla normalnych danych
Poniższy kod pokazuje, jak utworzyć wykres QQ dla zbioru danych zawierającego 1000 obserwacji wygenerowanych na podstawie rozkładu normalnego ze średnią 10 i odchyleniem standardowym 2:
/*generate 1000 values that follow normal distribution with mean 10 and sd 2 */
data normal_data;
do i = 1 to 1000;
x = 10 + 2* rannor (1);
output ;
end ;
run ;
/*create some plot*/
proc univariate data =normal_data noprint ;
qqplot x;
run ;
Widzimy, że punkty leżą głównie wzdłuż prostej linii ukośnej z niewielkimi odchyleniami wzdłuż każdego z ogonów.
Na podstawie tego wykresu możemy bezpiecznie założyć, że ten zbiór danych ma rozkład normalny.
Przykład 2: Wykres QQ dla danych innych niż normalne
Poniższy kod pokazuje, jak utworzyć wykres QQ dla zbioru danych zawierającego 1000 obserwacji wygenerowanych na podstawie rozkładu wykładniczego :
/*generate 1000 values that follow an exponential distribution*/
data exp_data;
do i = 1 to 1000;
x = ranexp (1);
output ;
end ;
run ;
/*create some plot*/
proc univariate data =exp_data noprint ;
qqplot x;
run ;
Widzę, że punkty znacznie odbiegają od prostej linii ukośnej. To wyraźnie wskazuje, że zbiór danych nie ma rozkładu normalnego.
Powinno to mieć sens, biorąc pod uwagę, że określiliśmy, że dane powinny mieć rozkład wykładniczy.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak używać Proc Univariate do testowania normalności w SAS-ie
Jak wykonać transformację dziennika w SAS-ie
Jak zidentyfikować wartości odstające w SAS