Excel: создание статистического сравнения двух наборов данных


Часто вам может потребоваться выполнить статистическое сравнение двух наборов данных в Excel, чтобы понять, чем отличается распределение значений в каждом наборе данных.

Существует два распространенных способа выполнения статистического сравнения:

Метод 1. Рассчитайте пятизначную сводку каждого набора данных.

Мы можем рассчитать пятизначную сводку каждого набора данных, которая состоит из следующих значений:

  • Минимальное значение
  • Первый квартиль (25-й процентиль)
  • Медиана (50-й процентиль)
  • Третий квартиль (75-й процентиль)
  • Максимум

Рассчитав эти пять значений, мы можем получить хорошее представление о распределении значений в каждом наборе данных.

Метод 2. Рассчитайте среднее и стандартное отклонение.

Более простой способ выполнить статистическое сравнение двух наборов данных — вычислить среднее и стандартное отклонение каждого набора данных.

Это помогает нам примерно понять, где находится «центральное» значение и каково распределение значений в каждом наборе данных.

В следующем примере показано, как использовать каждый из этих методов на практике.

Пример. Выполните статистическое сравнение двух наборов данных в Excel.

Предположим, у нас есть два набора данных в Excel, которые показывают результаты учащихся двух разных классов, полученные на конкретном экзамене:

Мы можем ввести следующие формулы в ячейки столбца E, чтобы рассчитать пятизначную сводку результатов экзамена для 1 класса:

  • E2 : =МИН(A2:A21)
  • E3 : =КВАРТИЛЬ(A2:A21, 1)
  • E4 : =МЕДИАНА(A2:A21)
  • E5 : =КВАРТИЛЬ(A2:A21, 3)
  • E6 : =MAX(A2:A21

Затем мы можем щелкнуть и перетащить эти формулы вправо, чтобы вычислить те же значения для класса 2:

Затем мы можем ввести следующие формулы в ячейки столбца E, чтобы рассчитать среднее и стандартное отклонение результатов экзамена для класса 1:

  • E8 : =СРЕДНЕЕ(A2:A21)
  • E9 : =ETDEV(A2:A21, 1)

Затем мы можем щелкнуть и перетащить эти формулы вправо, чтобы вычислить те же значения для класса 2:

статистическое сравнение двух наборов данных в Excel

Из этого статистического сравнения двух наборов данных мы можем сделать следующие выводы:

Вывод 1: Оба набора данных имеют схожую «основную» ценность.

Оба набора данных имеют средний балл на экзамене 81. Средние значения различаются незначительно: у первого класса средний балл на экзамене составляет 80,65, у второго класса средний балл на экзамене 80,65, а у второго класса средний балл на экзамене составляет 80,65. 80.65′ обзор 80.25.

Это говорит нам о том, что «базовый» или «типичный» балл на экзамене между двумя классами аналогичен.

Вывод 2: Первый набор данных имеет гораздо больший «разброс» значений.

Ряд показателей говорят нам о том, что результаты экзаменов первого класса разбросаны гораздо сильнее, чем результаты экзаменов второго класса.

Например, область применения класса 1 гораздо выше:

  • Диапазон класса 1: 96 – 65 = 31
  • Диапазон класса 2: 91 – 71 = 20

Межквартильный размах 1 класса также значительно выше:

  • Интерквартильный размах 1 класса: 90,25 – 71 = 19,25.
  • Интерквартильный размах 2 класса: 84,25 – 74,75 = 9,5.

Стандартное отклонение класса 1 также намного выше:

  • Стандартное отклонение класса 1: 10,21.
  • Стандартное отклонение класса 2: 6,43.

Каждый из этих показателей говорит нам о том, что разрыв в экзаменационных баллах у учащихся 1 класса намного выше, чем у учащихся 2 класса.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в Excel:

Как создать сводную таблицу в Excel
Как рассчитать медиану по группе в Excel
Как рассчитать стандартное отклонение и игнорировать ноль в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *