Jak przeprowadzić analizę jednowymiarową w r (z przykładami)
Termin analiza jednowymiarowa odnosi się do analizy jednej zmiennej. Możesz to zapamiętać, ponieważ przedrostek „uni” oznacza „jeden”.
Istnieją trzy popularne sposoby przeprowadzania analizy jednowymiarowej zmiennej:
1. Statystyka podsumowująca – mierzy środek i rozkład wartości.
2. Tabela częstotliwości – opisuje, jak często pojawiają się różne wartości.
3. Wykresy – służą do wizualizacji rozkładu wartości.
W tym samouczku przedstawiono przykład przeprowadzenia analizy jednowymiarowej dla następującej zmiennej:
#create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)
Statystyki podsumowujące
Możemy użyć następującej składni do obliczenia różnych statystyk podsumowujących dla naszej zmiennej:
#find means mean(x) [1] 5.706667 #find median median(x) [1] 5 #find range max(x) - min(x) [1] 13.2 #find interquartile range (spread of middle 50% of values) IQR(x) [1] 3.45 #find standard deviation sd(x) [1] 3.858287
Tabela częstotliwości
Możemy użyć następującej składni, aby utworzyć tabelę częstości dla naszej zmiennej:
#produce frequency table
table(s)
1 2 3.5 4 5 6.5 7 7.4 8 13 14.2
2 1 1 3 2 1 1 1 1 1 1
To mówi nam, że:
- Wartość 1 pojawia się dwukrotnie
- Wartość 2 pojawia się 1 raz
- Wartość 3,5 pojawia się 1 raz
I tak dalej.
Grafika
Możemy utworzyć wykres pudełkowy , korzystając z następującej składni:
#produce boxplot
boxplot(x)
Możemy utworzyć histogram, korzystając z następującej składni:
#produce histogram
hist(x)
Możemy utworzyć krzywą gęstości , korzystając z następującej składni:
#produce density curve
plot(density(x))
Każdy z tych wykresów daje nam unikalny sposób wizualizacji rozkładu wartości naszej zmiennej.
Więcej samouczków dotyczących języka R można znaleźć na tej stronie .