Pandas: csv 파일에서 특정 줄만 읽는 방법


다음 기본 구문을 사용하여 CSV 파일의 특정 줄만 Pandas DataFrame으로 읽을 수 있습니다.

 #specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)

이 특정 예에서는 my_data.csv 라는 CSV 파일에서 인덱스 위치 0, 2, 3의 행을 pandas DataFrame으로 읽습니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas의 CSV 파일에서 특정 줄만 읽기

Basketball_data.csv 라는 다음과 같은 CSV 파일이 있다고 가정해 보겠습니다.

read_csv() 함수를 사용하면 pandas는 자동으로 CSV 파일의 각 줄을 DataFrame으로 가져옵니다.

 import pandas as pd

#import all rows of CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ')

#view DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2

그러나 다음 구문을 사용하여 CSV 파일의 인덱스 위치 0, 2, 3에 있는 행만 pandas DataFrame으로 가져올 수 있습니다.

 import pandas as pd

#specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows)

#view DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6

CSV 파일의 인덱스 위치 0, 2, 3에 있는 행만 DataFrame으로 가져옵니다.

이 구문은 Skiprows 인수와 람다 함수를 사용하여 CSV 파일을 가져올 때 건너 뛰지 말아야 할 줄을 팬더에게 알려줍니다.

이 예에서는 팬더에게 CSV 파일을 가져올 때 인덱스 위치 0, 2, 3의 행을 무시하지 말고 다른 모든 행을 무시하라고 지시합니다.

참고 : 여기에서 pandas read_csv() 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Python에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: CSV 파일을 읽을 때 줄을 건너뛰는 방법
Pandas: 기존 CSV 파일에 데이터를 추가하는 방법
Pandas: CSV 파일을 가져올 때 유형을 지정하는 방법
Pandas: CSV 파일을 가져올 때 열 이름을 설정하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다