Как вычислить усеченное среднее значение в python (с примерами)


Обрезанное среднее значение — это среднее значение набора данных, которое было рассчитано после удаления определенного процента наименьших и наибольших значений в наборе данных.

Самый простой способ вычислить усеченное среднее значение в Python — использовать функцию Trim_mean() из библиотеки SciPy.

Эта функция использует следующий базовый синтаксис:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

Следующие примеры показывают, как использовать эту функцию для расчета усеченного среднего на практике.

Пример 1. Вычисление усеченного среднего значения таблицы.

Следующий код показывает, как вычислить усеченное среднее значение на 10 % для таблицы данных:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

Среднее значение, усеченное на 10 %, составляет 12,375 .

Это среднее значение набора данных после того, как из набора данных были удалены наименьшие 10% и самые большие 10% значений.

Пример 2. Вычисление усеченного среднего значения столбца в Pandas

В следующем коде показано, как вычислить усеченное среднее значение на 5 % для определенного столбца в DataFrame pandas:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

5%-ное усеченное среднее значений в столбце «пункты» составляет 20,25 .

Это среднее значение столбца «точек» после удаления 5 % наименьшего и 5 % наибольшего значений.

Пример 3. Вычисление усеченного среднего значения нескольких столбцов

В следующем коде показано, как вычислить усеченное среднее значение на 5 % для нескольких столбцов в DataFrame pandas:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

По результату мы видим:

  • Усеченное на 5% среднее значение столбца «пункты» составляет 20,25 .
  • Усеченное 5% среднее значение столбца «передачи» составляет 7,75 .

Примечание . Полную документацию по функции Trim_mean() можно найти здесь .

Дополнительные ресурсы

Как вручную вычислить усеченное среднее
Калькулятор усеченного среднего

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *