Jak znaleźć i wizualizować kwartyle w r
Kwartyle to wartości dzielące zbiór danych na cztery równe części.
- Pierwszy kwartyl reprezentuje 25. percentyl zbioru danych.
- Drugi kwartyl reprezentuje 50. percentyl zbioru danych. Wartość ta jest równa medianie wartości zbioru danych.
- Trzeci kwartyl reprezentuje 75. percentyl zbioru danych.
Możemy łatwo obliczyć kwartyle danego zbioru danych w R za pomocą funkcji quantile() .
W tym samouczku znajdują się przykłady wykorzystania tej funkcji w praktyce.
Obliczanie kwartylów w R
Poniższy kod pokazuje, jak obliczyć kwartyle danego zbioru danych w R:
#define dataset data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33) #calculate quartiles of dataset quantile(data) 0% 25% 50% 75% 100% 4.0 13.5 16.0 24.5 33.0
Oto jak zinterpretować wynik:
- Pierwsza wartość wyświetla minimalną wartość w zestawie danych: 4,0
- Druga wartość wyświetla pierwszy kwartyl zbioru danych: 13,5
- Trzecia wartość wyświetla drugi kwartyl zbioru danych: 16,0
- Czwarta wartość wyświetla trzeci kwartyl zbioru danych: 24,5
- Piąta wartość pokazuje maksymalną wartość w zbiorze danych: 33,0
Powiązane: Jak łatwo obliczyć percentyle w R
Wizualizacja kwartylów w R
Możemy użyć funkcji boxplot() , aby utworzyć wykres pudełkowy w celu wizualizacji kwartylów tego zbioru danych w R:
#create boxplot
boxplot(data)
Oto jak zinterpretować wykres pudełkowy:
- Dolny „wąs” wyświetla minimalną wartość 4 .
- W dolnym wierszu pola wyświetlana jest wartość pierwszego kwartyla wynosząca 13,5 .
- Czarny pasek pośrodku pola wyświetla wartość drugiego kwartyla wynoszącą 16,0 .
- W górnym wierszu pola wyświetlana jest wartość trzeciego kwartyla wynosząca 24,5 .
- Górny „wąs” pokazuje maksymalną wartość 33,0 .
Ten unikalny wykres pomaga nam szybko zwizualizować rozkład wartości w zbiorze danych.
Powiązane: Jak wykreślić wiele wykresów pudełkowych na jednym wykresie w języku R