Cara menemukan dan menghitung nilai yang hilang di r (dengan contoh)


Anda dapat menggunakan metode berikut untuk menemukan dan menghitung nilai yang hilang di R:

Metode 1: Temukan Lokasi Nilai yang Hilang

 which( is.na (df$column_name))

Metode 2: Hitung total nilai yang hilang

 sum( is.na (df$column_name))

Contoh berikut menunjukkan cara menggunakan fungsi-fungsi ini dalam praktik.

Contoh 1: Temukan dan hitung nilai yang hilang dalam sebuah kolom

Misalkan kita memiliki kerangka data berikut:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

Kita dapat menggunakan kode berikut untuk mengidentifikasi posisi yang memiliki nilai yang hilang di kolom “bantuan” dan mencari total nilai yang hilang di kolom “bantuan”:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Dari hasil tersebut terlihat bahwa posisi 1 , 3 dan 4 terdapat nilai yang hilang pada kolom ‘bantuan’ dan total ada 3 nilai yang hilang pada kolom tersebut.

Contoh 2: Hitung nilai yang hilang di semua kolom

Kode berikut menunjukkan cara menghitung total nilai yang hilang di setiap kolom bingkai data:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Dari hasilnya kita dapat melihat:

  • Kolom “tim” memiliki 1 nilai yang hilang.
  • Kolom “poin” berisi 0 nilai yang hilang.
  • Kolom “bantuan” memiliki 3 nilai yang hilang.
  • Kolom “rebound” memiliki 1 nilai yang hilang.

Contoh 3: Hitung nilai yang hilang di seluruh bingkai data

Kode berikut menunjukkan cara menghitung total nilai yang hilang di seluruh bingkai data:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

Dari hasilnya terlihat ada total 5 nilai yang hilang di seluruh frame data.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya dengan nilai yang hilang di R:

Bagaimana cara memasukkan semua nilai yang hilang di R
Bagaimana cara mengganti NA dengan string di R
Bagaimana cara mengganti NA dengan Zero di dplyr

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *