Jak rozpoznać asymetrię na wykresach pudełkowych


Wykres pudełkowy to rodzaj wykresu przedstawiający pięciocyfrowe podsumowanie zbioru danych, które obejmuje:

  • Wartość minimalna
  • Pierwszy kwartyl (25. percentyl)
  • Wartość średnia
  • Trzeci kwartyl (75. percentyl)
  • Maksymalna wartość

Aby narysować wykres pudełkowy, stosujemy następujący proces:

  • Narysuj prostokąt od pierwszego kwartyla (Q1) do trzeciego kwartyla (Q3)
  • Następnie narysuj linię wewnątrz pudełka na środku
  • Następnie narysuj „wąsy” kwartylów do wartości minimalnej i maksymalnej.

Możemy określić, czy rozkład jest skośny, czy nie, na podstawie tego, gdzie na wykresie pudełkowym znajduje się wartość mediany.

Asymetria wykresu pudełkowego

Kiedy mediana znajduje się bliżej dna pudełka, a wąs jest krótszy na dolnym końcu pudełka, rozkład jest skośny w prawo (lub „dodatni”).

Kiedy mediana znajduje się bliżej górnej krawędzi pudełka, a wąsy są krótsze na górnym końcu pudełka, rozkład pozostaje skośny (lub przekrzywiony „ujemnie”).

Kiedy mediana znajduje się pośrodku pudełka, a wąsy są w przybliżeniu równe po obu stronach, rozkład jest symetryczny (lub „nie” asymetryczny).

Poniższe przykłady ilustrują sposób użycia wykresów skrzynkowych do określenia, czy rozkład jest skośny w prawo, w lewo, czy też nie ma pochylenia.

Przykład 1: Rozkład prawoskośny

Rozkład rocznych dochodów gospodarstw domowych w Stanach Zjednoczonych jest prawostronny. Większość gospodarstw domowych zarabia od 40 000 do 80 000 dolarów rocznie, ale istnieje długi prawy koniec rozkładu reprezentujący gospodarstwa domowe, które zarabiają znacznie więcej.

Gdybyśmy stworzyli wykres pudełkowy do wizualizacji rozkładu dochodów gospodarstwa domowego, wyglądałby on tak:

Należy zauważyć, że pionowa linia wewnątrz ramki reprezentującej medianę znajduje się znacznie bliżej pierwszego kwartyla niż trzeciego kwartyla, co oznacza, że rozkład jest przesunięty w prawo.

Przykład 2: rozkład skośny w lewo

Rozkład wieku zgonów w większości populacji jest przesunięty w lewo. Większość ludzi żyje w wieku od 70 do 80 lat, a coraz mniej osób żyje poniżej tego wieku.

Gdybyśmy stworzyli wykres pudełkowy do wizualizacji rozkładu zgonów według wieku, wyglądałby tak:

Należy zauważyć, że pionowa linia wewnątrz ramki reprezentującej medianę znajduje się znacznie bliżej trzeciego kwartyla niż pierwszego kwartyla, co oznacza, że rozkład jest przesunięty w lewo.

Przykład 3: rozkład symetryczny

Rozkład wielkości samców jest w przybliżeniu symetryczny i nie wykazuje asymetrii. Na przykład średni wzrost mężczyzny w Stanach Zjednoczonych wynosi około 69,1 cala. Rozkład wysokości jest mniej więcej symetryczny, niektóre są krótsze, inne wyższe.

Gdybyśmy stworzyli wykres pudełkowy, aby zobrazować rozkład wzrostu mężczyzn w Stanach Zjednoczonych, wyglądałby tak:

Należy zauważyć, że pionowa linia wewnątrz ramki reprezentującej medianę znajduje się również blisko pierwszego i trzeciego kwartyla, co oznacza, że rozkład jest symetryczny i pozbawiony skośności.

Dodatkowe zasoby

Rozkłady skośne w lewo lub w prawo
Jak porównać wykresy pudełkowe: z przykładami
Jak tworzyć wykresy pudełkowe obok siebie w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *