Hoe u het gemiddelde kunt berekenen over kolommen in r (met voorbeelden)


Vaak wil je misschien de waarden over meerdere kolommen in R berekenen. Gelukkig is dit eenvoudig te doen met behulp van de functie rowMeans() .

Deze tutorial toont verschillende voorbeelden van praktisch gebruik van deze functie.

Voorbeeld 1: Zoek het gemiddelde over alle kolommen

De volgende code laat zien hoe u de gemiddelde waarde van elke rij voor alle kolommen in een gegevensframe berekent:

 #create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#view data frame
data

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

De manier om het resultaat te interpreteren is als volgt:

  • De gemiddelde waarde in de eerste rij is 2.333 .
  • De gemiddelde waarde in de tweede rij is 6 .
  • De gemiddelde waarde in de derde rij is 6 .
  • De gemiddelde waarde in de vierde rij is 6,333 .
  • De gemiddelde waarde in de vijfde rij is 7 .

U kunt deze rijgemiddelden ook toewijzen aan een nieuwe variabele in het gegevensframe:

 #assign row averages to new variable named row_mean
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Voorbeeld 2: Vind het gemiddelde van specifieke kolommen

Het is ook mogelijk om het gemiddelde alleen op specifieke kolommen van een dataframe te vinden. De volgende code laat bijvoorbeeld zien hoe u rijgemiddelden voor alleen de eerste twee kolommen berekent:

 #find row averages across first two columns
data$new <- rowMeans(data[, c(1,2)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

We kunnen dit zien:

  • De gemiddelde waarde van de eerste rij van de eerste twee kolommen is 2,5 .
  • De gemiddelde waarde van de tweede rij van de eerste twee kolommen is 5 .

Enzovoort.

U kunt een soortgelijke syntaxis gebruiken om rijgemiddelden voor elke reeks kolommen te vinden. De volgende code laat bijvoorbeeld zien hoe u rijgemiddelden alleen voor de eerste en derde kolom berekent:

 #find row averages across first and third columns
data$new <- rowMeans(data[, c(1,3)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

We kunnen dit zien:

  • De gemiddelde waarde van de eerste rij van de eerste en derde kolom is 1 .
  • De gemiddelde waarde in de tweede rij van de eerste en derde kolom is 7 .

Enzovoort.

Meer R-tutorials vindt u hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert