A: 특정 문자열이 포함된 줄을 삭제하는 방법


다음 구문을 사용하여 R의 데이터 프레임에서 특정 문자열이 포함된 줄을 제거할 수 있습니다.

 df[!grepl(' string ', df$column),]

이 튜토리얼에서는 R의 다음 데이터 프레임과 함께 이 구문을 실제로 사용하는 몇 가지 예를 제공합니다.

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conference=c('East', 'East', 'East', 'West', 'West', 'East'),
                 dots=c(11, 8, 10, 6, 6, 5))

#view data frame
df

  team conference points
1 A East 11
2 A East 8
3 A East 10
4 B West 6
5 B West 6
6 C East 5

예시 1: 특정 문자열이 포함된 행 제거

다음 코드는 팀 열에 “A”가 포함된 데이터 프레임의 모든 행을 삭제하는 방법을 보여줍니다.

 df[!grepl(' A ', df$team),]

  team conference points
4 B West 6
5 B West 6
6 C East 5

또는 회의 열에 “West”가 포함된 데이터 프레임의 모든 행을 제거할 수 있습니다.

 df[!grepl(' West ', df$conference),]

  team conference points
1 A East 11
2 A East 8
3 A East 10
6 C East 5

예 2: 목록에서 문자열을 포함하는 행 제거

다음 코드는 팀 열에 “A” 또는 “B”가 포함된 데이터 프레임의 모든 행을 삭제하는 방법을 보여줍니다.

 df[!grepl(' A|B ', df$team),]

6 C East 5

또한 문자열 벡터를 정의한 다음 팀 열에서 벡터 문자열을 포함하는 데이터 프레임의 모든 행을 삭제할 수도 있습니다.

 #define vector of strings
remove <- c(' A ', ' B ')

#remove rows that contain any string in the vector in the team column
df[!grepl( paste (remove, collapse=' | '), df$team),]

6 C East 5

두 방법 모두 동일한 결과를 가져온다는 점에 유의하세요.

추가 리소스

R에서 일부 또는 전체 NA가 있는 행을 삭제하는 방법
R에서 중복 줄을 제거하는 방법
R에서 특정 행을 합산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다