Pandas: como encontrar o valor máximo em cada linha


Você pode usar a seguinte sintaxe básica para encontrar o valor máximo em cada linha de um DataFrame do pandas:

 df[' max '] = df. max (axis= 1 )

Esta sintaxe específica cria uma nova coluna chamada max que contém o valor máximo em cada linha do DataFrame.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Encontre o valor máximo em cada linha no Pandas

Suponha que temos o seguinte DataFrame do pandas:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' points ': [4, np.nan, 10, 2, 15, np.nan, 7, 22],
                   ' rebounds ': [np.nan, 3, 9, 7, 6, 8, 14, 10],
                   ' assists ': [10, 9, 4, 4, 3, 7, 10, 11]})
    
#view DataFrame
print (df)

   points rebound assists
0 4.0 NaN 10
1 NaN 3.0 9
2 10.0 9.0 4
3 2.0 7.0 4
4 15.0 6.0 3
5 NaN 8.0 7
6 7.0 14.0 10
7 22.0 10.0 11

Podemos usar a seguinte sintaxe para criar uma nova coluna chamada max que contém o valor máximo em cada linha:

 #create new column that contains max value of each row
df[' max '] = df. max (axis= 1 )

#view updated DataFrame
print (df)

   points rebounds assists max
0 4.0 NaN 10 10.0
1 NaN 3.0 9 9.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0

A nova coluna chamada max contém o valor máximo em cada linha.

Por exemplo, podemos ver:

  • O valor máximo na primeira linha é 10 .
  • O valor máximo na segunda linha é 9 .
  • O valor máximo na terceira linha é 10 .

E assim por diante.

Observe também que a função max() ignora automaticamente os valores NaN ao determinar o valor máximo em cada linha.

Você também pode encontrar o valor máximo em cada linha apenas para colunas específicas.

Por exemplo, você pode usar a seguinte sintaxe para encontrar o valor máximo em cada linha e considerar apenas as colunas de pontos e rebotes :

 #add new column that contains max value of each row for points and rebounds columns
df[' max '] = df[[' points ', ' rebounds ']]. max (axis= 1 )

#view updated DataFrame
print (df)

   points rebounds assists max
0 4.0 NaN 10 4.0
1 NaN 3.0 9 3.0
2 10.0 9.0 4 10.0
3 2.0 7.0 4 7.0
4 15.0 6.0 3 15.0
5 NaN 8.0 7 8.0
6 7.0 14.0 10 14.0
7 22.0 10.0 11 22.0

A coluna chamada max agora contém o valor máximo em cada linha apenas para as colunas de pontos e rebotes .

Nota : Você pode encontrar a documentação completa para a função pandas max() aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Pandas: como encontrar o valor máximo em múltiplas colunas
Pandas: retorna uma linha com valor máximo em uma determinada coluna
Pandas: Como substituir inf por valor máximo

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *