Jak wybrać kolumny według indeksu w ramce danych pandas

Przez Benjamin Anderson 22 lipca, 2023 Przewodnik 0 komentarzy

Często możesz chcieć wybrać kolumny w ramce danych pand na podstawie ich wartości indeksu.

Jeśli chcesz wybrać kolumny w oparciu o indeksowanie liczb całkowitych, możesz użyć funkcji .iloc .

Jeśli chcesz wybrać kolumny na podstawie indeksowania etykiet, możesz użyć funkcji .loc .

W tym samouczku przedstawiono przykład praktycznego wykorzystania każdej z tych funkcji.

Przykład 1: Wybierz kolumny w oparciu o indeksowanie liczb całkowitych

Poniższy kod pokazuje, jak utworzyć pandę DataFrame i użyć .iloc , aby wybrać kolumnę z całkowitą wartością indeksu równą 3 :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

#select column with index position 3
df. iloc [:, 3]

0 11
1 8
2 10
3 6
4 6
5 5
Name: rebounds, dtype: int64

Możemy użyć podobnej składni, aby wybrać wiele kolumn:

 #select columns with index positions 1 and 3
df. iloc [:, [1, 3]]


        rebound points
0 11 11
1 7 8
2 8 10
3 10 6
4 13 6
5 13 5

Lub możemy wybrać wszystkie kolumny w zakresie:

 #select columns with index positions in range 0 through 3
df. iloc [:, 0:3]

        team points assists
0 to 11 5
1 To 7 7
2 to 8 7
3 B 10 9
4 B 13 12
5 B 13 9

Przykład 2: Wybierz kolumny na podstawie indeksowania etykiet

Poniższy kod pokazuje, jak utworzyć ramkę danych pandy i użyć .loc , aby wybrać kolumnę z etykietą indeksu „odbicia” :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [11, 7, 8, 10, 13, 13],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

	team points assists rebounds
0 A 11 5 11
1 To 7 7 8
2 to 8 7 10
3 B 10 9 6
4 B 13 12 6
5 B 13 9 5

#select column with index label 'rebounds'
df. loc [:, ' rebounds ']

0 11
1 8
2 10
3 6
4 6
5 5
Name: rebounds, dtype: int64

Możemy użyć podobnej składni, aby wybrać wiele kolumn z różnymi etykietami indeksu:

 #select the columns with index labels 'points' and 'rebounds'
df. loc [:,[' points ',' rebounds ']]

	rebound points
0 11 11
1 7 8
2 8 10
3 10 6
4 13 6
5 13 5

Lub możemy wybrać wszystkie kolumny w zakresie:

 #select columns with index labels between 'team' and 'assists'
df. loc [:, ' team ':' assists ']

	team points assists
0 to 11 5
1 To 7 7
2 to 8 7
3 B 10 9
4 B 13 12
5 B 13 9

Powiązane: Pandy loc vs iloc: jaka jest różnica?

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Jak grupować według indeksu w ramce danych Pandas
Jak wybierać wiersze według indeksu w ramce danych Pandas
Jak uzyskać numery wierszy w ramce danych Pandas
Jak usunąć kolumnę indeksu w ramce danych Pandas

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej

Przykład 1: Wybierz kolumny w oparciu o indeksowanie liczb całkowitych

Przykład 2: Wybierz kolumny na podstawie indeksowania etykiet

Dodatkowe zasoby

o autorze

Dr Benjamin Anderson

Dodaj komentarz