Como calcular uma média aparada em python (com exemplos)
Uma média aparada é a média de um conjunto de dados que foi calculada após a remoção de uma porcentagem específica dos menores e maiores valores do conjunto de dados.
A maneira mais fácil de calcular uma média aparada em Python é usar a função trim_mean() da biblioteca SciPy.
Esta função usa a seguinte sintaxe básica:
from scipy import stats #calculate 10% trimmed mean stats. trim_mean (data, 0.1 )
Os exemplos a seguir mostram como usar esta função para calcular uma média aparada na prática.
Exemplo 1: Calcule a média aparada da tabela
O código a seguir mostra como calcular uma média aparada de 10% para uma tabela de dados:
from scipy import stats #define data data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12] #calculate 10% trimmed mean stats. trim_mean (data, 0.1 ) 12,375
A média aparada de 10% é 12,375 .
Esta é a média do conjunto de dados após os 10% menores e os 10% maiores dos valores terem sido removidos do conjunto de dados.
Exemplo 2: Calcular a média aparada da coluna em Pandas
O código a seguir mostra como calcular uma média aparada de 5% para uma coluna específica em um DataFrame do pandas:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of points stats. trim_mean (df. points , 0.05 ) 20.25
A média aparada de 5% dos valores da coluna “pontos” é 20,25 .
Esta é a média da coluna “pontos” após a remoção dos 5% menores e 5% dos maiores valores.
Exemplo 3: Calcule a média aparada de múltiplas colunas
O código a seguir mostra como calcular uma média aparada de 5% para várias colunas em um DataFrame do pandas:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of 'points' and 'assists' columns stats. trim_mean (df[[' points ', ' assists ']], 0.05 ) array([20.25, 7.75])
Pelo resultado podemos ver:
- A média aparada de 5% da coluna “pontos” é 20,25 .
- A média aparada de 5% da coluna “assistências” é 7,75 .
Nota : Você pode encontrar a documentação completa da função trim_mean() aqui .
Recursos adicionais
Como calcular manualmente uma média aparada
Calculadora de média aparada