Pandas dataframe을 numpy 배열로 변환(예제 포함)
다음 구문을 사용하여 pandas DataFrame을 NumPy 배열로 변환할 수 있습니다.
df. to_numpy ()
다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다.
예시 1: 동일한 데이터 유형을 사용하여 DataFrame 변환
다음 코드는 DataFrame의 각 열이 동일한 데이터 유형일 때 pandas DataFrame을 NumPy 배열로 변환하는 방법을 보여줍니다.
import pandas as pd #create data frame df1 = pd. DataFrame ({' rebounds ': [7, 7, 8, 13, 7, 4], ' points ': [5, 7, 7, 9, 12, 9], ' assists ': [11, 8, 10, 6, 6, 5]}) #view data frame print (df1) rebound points assists 0 7 5 11 1 7 7 8 2 8 7 10 3 13 9 6 4 7 12 6 5 4 9 5 #convert DataFrame to NumPy array new = df1. to_numpy () #view NumPy array print (new) [[ 7 5 11] [7 7 8] [8 7 10] [13 9 6] [7 12 6] [4 9 5]] #confirm that new is a NumPy array print (type(new)) <class 'numpy.ndarray'> #view data type print (new. dtype ) int64
Numpy 배열의 데이터 유형은 int64 입니다. 원래 pandas DataFrame의 각 열은 int였기 때문입니다.
예 2: 혼합 데이터 유형을 사용하여 DataFrame 변환
다음 코드는 DataFrame의 열이 모두 동일한 데이터 유형이 아닌 경우 pandas DataFrame을 NumPy 배열로 변환하는 방법을 보여줍니다.
import pandas as pd #create data frame df2 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [5, 7, 7, 9, 12, 9], ' assists ': [11, 8, 10, 6, 6, 5]}) #view data frame print (df2) player points assists 0 to 5 11 1 B 7 8 2 C 7 10 3 D 9 6 4 E 12 6 5 F 9 5 #convert DataFrame to NumPy array new = df2. to_numpy () #view NumPy array print (new) [['A' 5 11] ['B' 7 8] ['C' 7 10] ['D' 9 6] ['E' 12 6] ['F' 9 5]] #confirm that new is a NumPy array print (type(new)) <class 'numpy.ndarray'> #view data type print (new. dtype ) object
Numpy 배열에는 원래 pandas DataFrame의 모든 열이 동일한 데이터 유형이 아니기 때문에 Object 데이터 유형이 있습니다.
예시 3: DataFrame 변환 및 NA 값 설정
다음 코드는 pandas DataFrame을 NumPy 배열로 변환하고 원본 DataFrame의 모든 NA 값에 대해 설정할 값을 지정하는 방법을 보여줍니다.
import pandas as pd #create data frame df3 = pd. DataFrame ({' player ': ['A', 'B', pd. NA , 'D', 'E', 'F'], ' points ': [5, 7, pd. NA , 9, pd. NA , 9], ' assists ': [11, 8, 10, 6, 6, 5]}) #view data frame print (df3) player points assists 0 to 5 11 1 B 7 8 2 <NA> <NA> 10 3 D 9 6 4 E <NA> 6 5 F 9 5 #convert DataFrame to NumPy array new = df3. to_numpy (na_value=' none ') #view NumPy array print (new) [['A' 5 11] ['B' 7 8] ['none' 'none' 10] ['D' 9 6] ['E' 'none' 6] ['F' 9 5]] #confirm that new is a NumPy array print (type(new)) <class 'numpy.ndarray'> #view data type print (new. dtype ) object
추가 리소스
NumPy 배열에서 Pandas DataFrame을 만드는 방법
Pandas에서 목록을 DataFrame으로 변환하는 방법
Pandas에서 DataFrame을 목록으로 변환하는 방법