A diferença entre axis=0 e axis=1 em pandas
Muitas funções no pandas exigem que você especifique um eixo ao longo do qual aplicar um determinado cálculo.
Geralmente, aplica-se a seguinte regra:
- axis=0 : Aplique o cálculo “por coluna”
- axis=1 : Aplique o cálculo “por linha”
Os exemplos a seguir mostram como usar o argumento axis em diferentes cenários com o seguinte DataFrame do pandas:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
' points ': [25, 12, 15, 14, 19, 23, 25, 29],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
df
team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12
Exemplo 1: Encontrando a média ao longo de diferentes eixos
Podemos usar axis=0 para encontrar a média de cada coluna no DataFrame:
#find mean of each column
df. mean (axis= 0 )
points 20.250
assists 7,750
rebounds 8,375
dtype:float64
A saída exibe o valor médio de cada coluna numérica no DataFrame.
Observe que o pandas evita automaticamente a média da coluna “equipe” porque é uma coluna de caracteres.
Também podemos usar axis=1 para encontrar a média de cada linha no DataFrame:
#find mean of each row
df. mean (axis= 1 )
0 13.666667
1 9.000000
2 10.666667
3 9.666667
4 12.333333
5 12.333333
6 14.333333
7 15.000000
dtype:float64
Pelo resultado podemos ver:
- O valor médio da primeira linha é 13,667 .
- O valor médio na segunda linha é 9000 .
- O valor médio na terceira linha é 10.667 .
E assim por diante.
Exemplo 2: Encontrando a soma ao longo de diferentes eixos
Podemos usar axis=0 para encontrar a soma de colunas específicas no DataFrame:
#find sum of 'points' and 'assists' columns
df[[' points ', ' assists ']]. sum (axis= 0 )
points 162
assists 62
dtype: int64
Também podemos usar axis=1 para encontrar a soma de cada linha no DataFrame:
#find sum of each row
df. sum (axis= 1 )
0 41
1 27
2 32
3 29
4 37
5 37
6 43
7 45
dtype: int64
Exemplo 3: Encontrando Max ao longo de eixos diferentes
Podemos usar axis=0 para encontrar o valor máximo de colunas específicas no DataFrame:
#find max of 'points', 'assists', and 'rebounds' columns
df[[' points ', ' assists ', ' rebounds ']]. max (axis= 0 )
points 29
assists 12
rebounds 12
dtype: int64
Também podemos usar axis=1 para encontrar o valor máximo de cada linha no DataFrame:
#find max of each row
df. max (axis= 1 )
0 25
1 12
2 15
3 14
4 19
5 23
6 25
7 29
dtype: int64
Pelo resultado podemos ver:
- O valor máximo na primeira linha é 25 .
- O valor máximo na segunda linha é 12 .
- O valor máximo na terceira linha é 15 .
E assim por diante.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como calcular a média das colunas no Pandas
Como calcular a soma das colunas no Pandas
Como encontrar o valor máximo das colunas no Pandas