R'deki na'ların bir kısmını veya tamamını içeren satırlar nasıl silinir?


Genellikle R’deki bir veri çerçevesindeki NA’ların (eksik değerler) bir kısmını veya tamamını içeren satırları kaldırmak isteyebilirsiniz.

Bu eğitimde, Basic R ve Tidyr paketini kullanarak bu çizgilerin nasıl kaldırılacağı açıklanmaktadır. Aşağıdaki örneklerin her biri için aşağıdaki veri çerçevesini kullanacağız:

 #create data frame with some missing values
df <- data.frame(points = c(12, NA, 19, 22, 32),
                 assists = c(4, NA, 3, NA, 5),
                 rebounds = c(5, NA, 7, 12, NA))

#view data frame
df

  points assists rebounds
1 12 4 5
2 NA NA NA
3 19 3 7
4 22 NA 12
5 32 5 NA

Base R’yi kullanarak NA’ları kaldırın

Aşağıdaki kod, bir sütunda eksik değeri olan bir veri çerçevesindeki tüm satırları kaldırmak içincomplete.cases() işlevinin nasıl kullanılacağını gösterir:

 #remove all rows with a missing value in any column
df[ complete.cases (df),]

  points assists rebounds
1 12 4 5
3 19 3 7

Aşağıdaki kod, bir veri çerçevesindeki belirli sütunlarda eksik değere sahip tüm satırları kaldırmak içincomplete.cases() işlevinin nasıl kullanılacağını gösterir:

 #remove all rows with a missing value in the third column
df[ complete.cases (df[,3]),]

  points assists rebounds
1 12 4 5
3 19 3 7
4 22 NA 12

#remove all rows with a missing value in either the first or third column
df[ complete.cases (df[ , c(1,3)]),]

  points assists rebounds
1 12 4 5
3 19 3 7
4 22 NA 12

Tidyr kullanarak NA’ları silin

Aşağıdaki kod, bir sütunda eksik değere sahip bir veri çerçevesindeki tüm satırları bırakmak için Tidyr paketindeki drop_na() işlevinin nasıl kullanılacağını gösterir:

 #load tidyr package
library(tidyr)

#remove all rows with a missing value in any column
df %>% drop_na()

  points assists rebounds
1 12 4 5
3 19 3 7

Aşağıdaki kod, belirli sütunlarda eksik değere sahip bir veri çerçevesindeki tüm satırları bırakmak için Tidyr paketindeki drop_na() işlevinin nasıl kullanılacağını gösterir:

 #load tidyr package
library(tidyr)

#remove all rows with a missing value in the third column
df %>% drop_na(rebounds)

  points assists rebounds
1 12 4 5
3 19 3 7
4 22 NA 12

Daha fazla R eğitimini burada bulabilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir