Cara menggunakan na.rm di r (dengan contoh)


Anda dapat menggunakan argumen na.rm=TRUE untuk mengecualikan nilai yang hilang saat menghitung statistik deskriptif di R.

 #calculate mean and exclude missing values
mean(x, na. rm = TRUE )

#calculate sum and exclude missing values 
sum(x, na. rm = TRUE )

#calculate maximum and exclude missing values 
max(x, na. rm = TRUE )

#calculate standard deviation and exclude missing values 
sd(x, na. rm = TRUE )

Contoh berikut menunjukkan cara menggunakan argumen ini dalam praktik dengan vektor dan bingkai data.

Contoh 1: Menggunakan na.rm dengan vektor

Misalkan kita mencoba menghitung mean, jumlah, maksimum, dan deviasi standar dari vektor berikut di R yang berisi nilai yang hilang:

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x)

[1] NA

sum(x)

[1] NA

max(x)

[1] NA

sd(x)

[1] NA

Masing-masing fungsi ini mengembalikan nilai NA .

Untuk mengecualikan nilai yang hilang saat melakukan perhitungan ini, kita cukup menyertakan argumen na.rm = TRUE sebagai berikut:

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x, na. rm = TRUE )

[1] 7.428571

sum(x, na. rm = TRUE )

[1] 52

max(x, na. rm = TRUE )

[1] 16

sd(x, na. rm = TRUE )

[1] 4.790864

Perhatikan bahwa kami berhasil melakukan setiap penghitungan dengan mengecualikan nilai yang hilang.

Contoh 2: Menggunakan na.rm dengan bingkai data

Misalkan kita memiliki bingkai data berikut di R yang berisi nilai yang hilang:

 #create data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, NA, 3, 2),
                 var3=c(3, 3, NA, 6, 8),
                 var4=c(1, 1, 2, 8, NA))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 NA NA 2
4 4 3 6 8
5 5 2 8 NA

Kita dapat menggunakan fungsi apply() untuk menghitung statistik deskriptif untuk setiap kolom dalam bingkai data dan menggunakan argumen na.rm = TRUE untuk mengecualikan nilai yang hilang saat melakukan penghitungan berikut:

 #calculate mean of each column
apply(df, 2, mean, na. rm = TRUE )

var1 var2 var3 var4 
3.20 4.75 5.00 3.00 

#calculate sum of each column
apply(df, 2, sum, na. rm = TRUE )

var1 var2 var3 var4 
  16 19 20 12 

#calculate max of each column
apply(df, 2, max, na. rm = TRUE )

var1 var2 var3 var4 
   5 7 8 8 

#calculate standard deviation of each column
apply(df, 2, sd, na. rm = TRUE )

    var1 var2 var3 var4 
1.483240 2.629956 2.449490 3.366502

Sekali lagi, kami berhasil menyelesaikan setiap penghitungan tanpa menyertakan nilai yang hilang.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan nilai yang hilang di R:

Cara menggunakan is.null di R
Cara menggunakan na.omit di R
Cara menggunakan is.na di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *