Pandas: 1부터 시작하여 행의 색인을 다시 생성하는 방법


다음 기본 구문을 사용하여 0 대신 1부터 시작하여 Pandas DataFrame의 행을 다시 색인화할 수 있습니다.

 import pandas as pd
import numpy as np

df. index = np. arange (1, len (df)+1)

NumPy arange() 함수는 1부터 시작하여 전체 DataFrame 길이에 1을 더할 때까지 1씩 증가하는 배열을 만듭니다.

그런 다음 이 배열은 DataFrame의 인덱스로 사용됩니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: 1부터 시작하여 Pandas DataFrame의 행 색인을 다시 생성합니다.

다양한 농구 선수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
                   
#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

현재 인덱스 범위는 0에서 7까지입니다.

인덱스의 값을 1부터 시작하여 열로 다시 인덱싱하려면 다음 구문을 사용할 수 있습니다.

 import numpy as np

#reindex values in index to start from 1
df. index = np. arange (1, len (df)+1)

#view updated DataFrame
print (df)

  team points assists rebounds
1 A 18 5 11
2 B 22 7 8
3 C 19 7 10
4 D 14 9 6
5 E 14 12 6
6 F 11 9 5
7 G 20 9 9
8:28 a.m. 4:12

이제 인덱스 값은 1부터 시작합니다.

참고 #1 : len() 함수를 사용하여 DataFrame의 행 수를 찾는 이점은 새 배열을 생성하기 전에 DataFrame에 몇 개의 행이 있는지 알 필요가 없다는 것입니다. 인덱스 값.

참고 #2 : NumPy arange() 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 인덱스 이름을 제거하는 방법
Pandas에서 MultiIndex를 평면화하는 방법
Pandas의 인덱스에서 고유 값을 얻는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다