A: hitung jumlah nilai na pada setiap kolom


Anda dapat menggunakan metode berikut untuk menghitung jumlah nilai NA di setiap kolom bingkai data di R:

Metode 1: Hitung nilai NA pada setiap kolom menggunakan basis R

 sapply(df, function (x) sum(is. na (x)))

Metode 2: Hitung nilai NA di setiap kolom menggunakan dplyr

 library (dplyr)

df %>% summarise(across(everything(), ~ sum(is. na (.))))

Contoh berikut menunjukkan cara menggunakan setiap metode dengan bingkai data berikut di R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, NA),
                 assists=c(33, NA, NA, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 NA 28
3 C 86 NA 24
4 D 88 39 24
5 E NA 34 28

Contoh 1: Hitung nilai NA pada setiap kolom menggunakan basis R

Kode berikut menunjukkan cara menghitung jumlah nilai NA di setiap kolom menggunakan fungsi R base sapply() :

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

Dari hasilnya kita dapat melihat:

  • Kolom tim memiliki nilai 0 NA.
  • Kolom poin mempunyai nilai 1 NA.
  • Kolom assist memiliki 2 nilai NA.
  • Kolom pentalan memiliki nilai 0 NA.

Catatan : Fungsi sapply() dapat digunakan untuk menerapkan fungsi ke setiap kolom dalam bingkai data. Dalam contoh ini, kita menerapkan fungsi yang menghitung jumlah total elemen yang sama dengan NA.

Contoh 2: Hitung nilai NA pada setiap kolom menggunakan dplyr

Kode berikut menunjukkan cara menghitung jumlah nilai NA pada setiap kolom menggunakan fungsi summarise() dari paket dplyr :

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

Dari hasilnya kita dapat melihat:

  • Kolom tim memiliki nilai 0 NA.
  • Kolom poin mempunyai nilai 1 NA.
  • Kolom assist memiliki 2 nilai NA.
  • Kolom pentalan memiliki nilai 0 NA.

Hasil ini sesuai dengan contoh sebelumnya.

Catatan : Metode dplyr cenderung lebih cepat dibandingkan metode dasar R ketika bekerja dengan frame data yang sangat besar.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menggunakan na.omit di R
Cara menggunakan complete.cases di R
Cara menghapus baris kosong dari bingkai data di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *