Pandas: como encontrar o valor máximo em cada linha
Você pode usar a seguinte sintaxe básica para encontrar o valor máximo em cada linha de um DataFrame do pandas:
df[' max '] = df. max (axis= 1 )
Esta sintaxe específica cria uma nova coluna chamada max que contém o valor máximo em cada linha do DataFrame.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Encontre o valor máximo em cada linha no Pandas
Suponha que temos o seguinte DataFrame do pandas:
import pandas as pd
import numpy as np
#createDataFrame
df = pd. DataFrame ({' points ': [4, np.nan, 10, 2, 15, np.nan, 7, 22],
' rebounds ': [np.nan, 3, 9, 7, 6, 8, 14, 10],
' assists ': [10, 9, 4, 4, 3, 7, 10, 11]})
#view DataFrame
print (df)
points rebound assists
0 4.0 NaN 10
1 NaN 3.0 9
2 10.0 9.0 4
3 2.0 7.0 4
4 15.0 6.0 3
5 NaN 8.0 7
6 7.0 14.0 10
7 22.0 10.0 11
Podemos usar a seguinte sintaxe para criar uma nova coluna chamada max que contém o valor máximo em cada linha:
#create new column that contains max value of each row
df[' max '] = df. max (axis= 1 )
#view updated DataFrame
print (df)
points rebounds assists max
0 4.0 NaN 10 10.0
1 NaN 3.0 9 9.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0
A nova coluna chamada max contém o valor máximo em cada linha.
Por exemplo, podemos ver:
- O valor máximo na primeira linha é 10 .
- O valor máximo na segunda linha é 9 .
- O valor máximo na terceira linha é 10 .
E assim por diante.
Observe também que a função max() ignora automaticamente os valores NaN ao determinar o valor máximo em cada linha.
Você também pode encontrar o valor máximo em cada linha apenas para colunas específicas.
Por exemplo, você pode usar a seguinte sintaxe para encontrar o valor máximo em cada linha e considerar apenas as colunas de pontos e rebotes :
#add new column that contains max value of each row for points and rebounds columns
df[' max '] = df[[' points ', ' rebounds ']]. max (axis= 1 )
#view updated DataFrame
print (df)
points rebounds assists max
0 4.0 NaN 10 4.0
1 NaN 3.0 9 3.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0
A coluna chamada max agora contém o valor máximo em cada linha apenas para as colunas de pontos e rebotes .
Nota : Você pode encontrar a documentação completa para a função pandas max() aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Pandas: como encontrar o valor máximo em múltiplas colunas
Pandas: retorna uma linha com valor máximo em uma determinada coluna
Pandas: Como substituir inf por valor máximo