Como calcular o desvio padrão em pandas: com exemplos


Você pode usar a função DataFrame.std() para calcular o desvio padrão dos valores em um DataFrame do pandas.

Você pode usar os seguintes métodos para calcular o desvio padrão na prática:

Método 1: Calcular o desvio padrão de uma coluna

 df [ ' column_name ' ] . std ( )

Método 2: Calcular o desvio padrão de múltiplas colunas

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Método 3: Calcule o desvio padrão de todas as colunas numéricas

 df . std ( )

Observe que a função std() irá ignorar automaticamente quaisquer valores NaN no DataFrame ao calcular o desvio padrão.

Os exemplos a seguir mostram como usar cada método com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Método 1: Calcular o desvio padrão de uma coluna

O código a seguir mostra como calcular o desvio padrão de uma coluna no DataFrame:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

O desvio padrão é 6,1586 .

Método 2: Calcular o desvio padrão de múltiplas colunas

O código a seguir mostra como calcular o desvio padrão de múltiplas colunas no DataFrame:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

O desvio padrão da coluna “pontos” é 6,1586 e o desvio padrão da coluna “rebotes” é 2,5599 .

Método 3: Calcule o desvio padrão de todas as colunas numéricas

O código a seguir mostra como calcular o desvio padrão de cada coluna numérica no DataFrame:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Observe que o pandas não calculou o desvio padrão da coluna “equipe”, pois não era uma coluna numérica.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como calcular a média das colunas no Pandas
Como calcular a mediana da coluna no Pandas
Como calcular o valor máximo das colunas no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *