Hoe de standaardfout van het gemiddelde in r te berekenen
De standaardfout van het gemiddelde is een manier om de verdeling van waarden in een dataset te meten. Het wordt als volgt berekend:
Standaardfout = s / √n
Goud:
- s : standaardafwijking van het monster
- n : steekproefomvang
In deze tutorial worden twee methoden uitgelegd die u kunt gebruiken om de standaardfout van een dataset in R te berekenen.
Methode 1: Gebruik de Plotrix-bibliotheek
De eerste manier om de standaardfout van het gemiddelde te berekenen is door de ingebouwde functie std.error() van de Plotrix-bibliotheek te gebruiken.
De volgende code laat zien hoe u deze functie kunt gebruiken:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
De standaardfout van het gemiddelde blijkt 2,001447 te zijn.
Methode 2: Definieer uw eigen functie
Een andere manier om de standaardfout van het gemiddelde van een dataset te berekenen, is door eenvoudigweg uw eigen functie te definiëren.
De volgende code laat zien hoe u dit doet:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Opnieuw blijkt de standaardfout van het gemiddelde 2,0014 te zijn.
Hoe de standaardfout van het gemiddelde te interpreteren
De standaardfout van het gemiddelde is eenvoudigweg een maatstaf voor de spreiding van waarden rond het gemiddelde.
Er zijn twee dingen waarmee u rekening moet houden bij het interpreteren van de standaardfout van het gemiddelde:
1. Hoe groter de standaardfout van het gemiddelde, hoe meer verspreid de waarden rond het gemiddelde in een dataset liggen.
Om dit te illustreren, overweeg of we de laatste waarde van de vorige dataset met een veel groter getal veranderen:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Merk op hoe de standaardfout toeneemt van 2.001447 naar 6.978265 .
Dit geeft aan dat de waarden in deze dataset meer rond het gemiddelde verdeeld zijn vergeleken met de vorige dataset.
2. Naarmate de steekproefomvang toeneemt, neigt de standaardfout van het gemiddelde af te nemen.
Om dit te illustreren, beschouwen we de standaardfout van het gemiddelde voor de volgende twee sets gegevens:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
De tweede dataset is eenvoudigweg de eerste dataset die twee keer wordt herhaald.
Beide datasets hebben dus hetzelfde gemiddelde, maar de tweede dataset heeft een grotere steekproefomvang en heeft daarom een kleinere standaardfout.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe de steekproef- en populatievariantie in R te berekenen
Hoe de gepoolde variantie in R te berekenen
Hoe de variatiecoëfficiënt van R te berekenen