Univariate analyse uitvoeren in r (met voorbeelden)
De term univariate analyse verwijst naar de analyse van één variabele. U kunt dit onthouden omdat het voorvoegsel “uni” “één” betekent.
Er zijn drie veelgebruikte manieren om univariate analyses op een variabele uit te voeren:
1. Samenvattende statistieken – Meet het centrum en de verdeling van waarden.
2. Frequentietabel – Beschrijft hoe vaak verschillende waarden verschijnen.
3. Grafieken – Wordt gebruikt om de verdeling van waarden te visualiseren.
In deze zelfstudie wordt een voorbeeld gegeven van hoe u een univariate analyse uitvoert voor de volgende variabele:
#create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)
Samenvattende statistieken
We kunnen de volgende syntaxis gebruiken om verschillende samenvattende statistieken voor onze variabele te berekenen:
#find means mean(x) [1] 5.706667 #find median median(x) [1] 5 #find range max(x) - min(x) [1] 13.2 #find interquartile range (spread of middle 50% of values) IQR(x) [1] 3.45 #find standard deviation sd(x) [1] 3.858287
Frequentietabel
We kunnen de volgende syntaxis gebruiken om een frequentietabel voor onze variabele te maken:
#produce frequency table
table(s)
1 2 3.5 4 5 6.5 7 7.4 8 13 14.2
2 1 1 3 2 1 1 1 1 1 1
Dit vertelt ons dat:
- De waarde 1 verschijnt tweemaal
- De waarde 2 verschijnt 1 keer
- De waarde 3,5 verschijnt 1 keer
Enzovoort.
Grafisch
We kunnen een boxplot maken met behulp van de volgende syntaxis:
#produce boxplot
boxplot(x)
We kunnen een histogram maken met behulp van de volgende syntaxis:
#produce histogram
hist(x)
We kunnen een dichtheidscurve maken met behulp van de volgende syntaxis:
#produce density curve
plot(density(x))
Elk van deze grafieken geeft ons een unieke manier om de verdeling van de waarden van onze variabele te visualiseren.
Op deze pagina vindt u meer R-tutorials.