Hoe u het gemiddelde van een kolom in r kunt berekenen (met voorbeelden)
U kunt een van de volgende methoden gebruiken om het gemiddelde van een kolom in R te berekenen:
#calculate mean using column name mean(df$my_column) #calculate mean using column name (ignore missing values) mean(df$my_column, na. rm = TRUE ) #calculate mean using column position mean(df[, 1]) #calculation mean of all numeric columns colMeans(df[sapply(df, is. numeric )])
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met het volgende dataframe in R:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), points=c(99, 90, 93, 86, 88, 82), assists=c(33, 28, 31, 39, NA, 30)) #view data frame df team points assists 1 A 99 33 2 A 90 28 3 A 93 31 4 B 86 39 5 B 88 NA 6 B 82 30
Voorbeeld 1: Bereken het gemiddelde met behulp van de kolomnaam
De volgende code laat zien hoe u het gemiddelde van de kolom ‚punten‘ kunt berekenen met behulp van de kolomnaam:
#calculate mean of 'points' column
mean(df$points)
[1] 89.66667
De gemiddelde waarde in de kolom “punten” is 89,66667 .
Voorbeeld 2: Bereken het gemiddelde met behulp van de kolomnaam (negeer ontbrekende waarden)
Als we proberen het gemiddelde te berekenen van een kolom die ontbrekende waarden bevat, krijgen we NA :
#attempt to calculate mean of 'assists' column
mean(df$assists)
[1] NA
We moeten na.rm=TRUE gebruiken om ontbrekende waarden te negeren bij het berekenen van het kolomgemiddelde:
#calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )
[1] 32.2
De gemiddelde waarde in de kolom ‘assisten’ is 32,2 .
Voorbeeld 3: Bereken het gemiddelde met behulp van de kolompositie
De volgende code laat zien hoe u het gemiddelde van de kolom op indexpositie 2 berekent:
#calculate mean of column in index position 2
mean(df[, 2])
[1] 89.66667
De gemiddelde waarde van de kolom op indexpositie 2 (de kolom „punten“) is 89,66667 .
Voorbeeld 4: Bereken het gemiddelde van alle numerieke kolommen
De volgende code laat zien hoe u het gemiddelde van alle numerieke kolommen in het gegevensframe berekent:
#calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )
assist points
89.66667 32.20000
De uitvoer geeft de gemiddelde waarde van elke numerieke kolom in het gegevensframe weer.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere gemiddelde waarden in R kunt berekenen:
Hoe een getrimd gemiddelde in R te berekenen
Hoe het geometrische gemiddelde in R te berekenen
Hoe een gewogen gemiddelde in R te berekenen