Como calcular uma média aparada em python (com exemplos)


Uma média aparada é a média de um conjunto de dados que foi calculada após a remoção de uma porcentagem específica dos menores e maiores valores do conjunto de dados.

A maneira mais fácil de calcular uma média aparada em Python é usar a função trim_mean() da biblioteca SciPy.

Esta função usa a seguinte sintaxe básica:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

Os exemplos a seguir mostram como usar esta função para calcular uma média aparada na prática.

Exemplo 1: Calcule a média aparada da tabela

O código a seguir mostra como calcular uma média aparada de 10% para uma tabela de dados:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

A média aparada de 10% é 12,375 .

Esta é a média do conjunto de dados após os 10% menores e os 10% maiores dos valores terem sido removidos do conjunto de dados.

Exemplo 2: Calcular a média aparada da coluna em Pandas

O código a seguir mostra como calcular uma média aparada de 5% para uma coluna específica em um DataFrame do pandas:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

A média aparada de 5% dos valores da coluna “pontos” é 20,25 .

Esta é a média da coluna “pontos” após a remoção dos 5% menores e 5% dos maiores valores.

Exemplo 3: Calcule a média aparada de múltiplas colunas

O código a seguir mostra como calcular uma média aparada de 5% para várias colunas em um DataFrame do pandas:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

Pelo resultado podemos ver:

  • A média aparada de 5% da coluna “pontos” é 20,25 .
  • A média aparada de 5% da coluna “assistências” é 7,75 .

Nota : Você pode encontrar a documentação completa da função trim_mean() aqui .

Recursos adicionais

Como calcular manualmente uma média aparada
Calculadora de média aparada

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *