Jak przeprowadzić analizę jednowymiarową w r (z przykładami)


Termin analiza jednowymiarowa odnosi się do analizy jednej zmiennej. Możesz to zapamiętać, ponieważ przedrostek „uni” oznacza „jeden”.

Istnieją trzy popularne sposoby przeprowadzania analizy jednowymiarowej zmiennej:

1. Statystyka podsumowująca – mierzy środek i rozkład wartości.

2. Tabela częstotliwości – opisuje, jak często pojawiają się różne wartości.

3. Wykresy – służą do wizualizacji rozkładu wartości.

W tym samouczku przedstawiono przykład przeprowadzenia analizy jednowymiarowej dla następującej zmiennej:

 #create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)

Statystyki podsumowujące

Możemy użyć następującej składni do obliczenia różnych statystyk podsumowujących dla naszej zmiennej:

 #find means
mean(x)
[1] 5.706667

#find median
median(x)

[1] 5

#find range
max(x) - min(x)

[1] 13.2

#find interquartile range (spread of middle 50% of values)
IQR(x)

[1] 3.45

#find standard deviation
sd(x)

[1] 3.858287

Tabela częstotliwości

Możemy użyć następującej składni, aby utworzyć tabelę częstości dla naszej zmiennej:

 #produce frequency table
table(s)

   1 2 3.5 4 5 6.5 7 7.4 8 13 14.2 
   2 1 1 3 2 1 1 1 1 1 1 

To mówi nam, że:

  • Wartość 1 pojawia się dwukrotnie
  • Wartość 2 pojawia się 1 raz
  • Wartość 3,5 pojawia się 1 raz

I tak dalej.

Grafika

Możemy utworzyć wykres pudełkowy , korzystając z następującej składni:

 #produce boxplot
boxplot(x)

Możemy utworzyć histogram, korzystając z następującej składni:

 #produce histogram
hist(x) 

Możemy utworzyć krzywą gęstości , korzystając z następującej składni:

 #produce density curve
plot(density(x)) 

Każdy z tych wykresów daje nam unikalny sposób wizualizacji rozkładu wartości naszej zmiennej.


Więcej samouczków dotyczących języka R można znaleźć na tej stronie .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *