Excel: створіть статистичне порівняння двох наборів даних


Часто вам може знадобитися виконати статистичне порівняння двох наборів даних у Excel, щоб зрозуміти, чим відрізняється розподіл значень у кожному наборі даних.

Існує два поширених способи статистичного порівняння:

Спосіб 1: обчисліть п’ятизначний підсумок кожного набору даних

Ми можемо обчислити п’ятизначний підсумок кожного набору даних, який складається з таких значень:

  • Мінімальне значення
  • Перший квартиль (25 процентиль)
  • Медіана (50-й процентиль)
  • Третій квартиль (75-й процентиль)
  • Максимум

Обчисливши ці п’ять значень, ми можемо отримати гарне розуміння розподілу значень у кожному наборі даних.

Спосіб 2: обчисліть середнє значення та стандартне відхилення

Більш простий спосіб виконати статистичне порівняння двох наборів даних — обчислити середнє значення та стандартне відхилення кожного набору даних.

Це допомагає нам приблизно зрозуміти, де знаходиться «центральне» значення і який розподіл значень у кожному наборі даних.

У наступному прикладі показано, як використовувати кожен із цих методів на практиці.

Приклад: виконайте статистичне порівняння двох наборів даних у Excel

Припустімо, що ми маємо два набори даних в Excel, які показують результати студентів двох різних класів, отримані на конкретному іспиті:

Ми можемо ввести наступні формули в комірки стовпця E, щоб обчислити п’ятизначний підсумок іспитів для 1 класу:

  • E2 : =MIN(A2:A21)
  • E3 : =КВАРТИЛЬ(A2:A21; 1)
  • E4 : =MEDIAN(A2:A21)
  • E5 : =КВАРТИЛЬ(A2:A21; 3)
  • E6 : =MAX(A2:A21

Потім ми можемо клацнути й перетягнути ці формули праворуч, щоб обчислити ті самі значення для класу 2:

Потім ми можемо ввести такі формули в комірки стовпця E, щоб обчислити середнє значення та стандартне відхилення результатів іспиту для 1 класу:

  • E8 : =СЕРЕДНЄ (A2:A21)
  • E9 : =ETDEV(A2:A21; 1)

Потім ми можемо клацнути й перетягнути ці формули праворуч, щоб обчислити ті самі значення для класу 2:

статистичне порівняння двох наборів даних в Excel

З цього статистичного порівняння двох наборів даних ми можемо зробити наступні висновки:

Висновок 1: обидва набори даних мають однакову «основну» цінність.

Обидва набори даних мають середній іспитовий бал 81. Середні значення відрізняються лише незначно: перший клас має середній іспитовий бал 80,65, другий клас має середній іспитовий бал 80,65, а другий клас має середній іспитовий бал 80,65. 80.65 ‘ огляд 80.25.

Це говорить нам про те, що «основний» або «типовий» іспитовий бал у двох класах подібний.

Висновок 2: перший набір даних має набагато більшу «дисперсію» значень.

Кілька показників говорять нам про те, що результати іспитів першого класу значно розрізнені, ніж результати другого класу.

Наприклад, обсяг класу 1 набагато вищий:

  • Діапазон класу 1: 96 – 65 = 31
  • Діапазон класу 2: 91 – 71 = 20

Інтерквартильний діапазон класу 1 також значно вищий:

  • Інтерквартильний діапазон класу 1: 90,25 – 71 = 19,25
  • Інтерквартильний діапазон 2 класу: 84,25 – 74,75 = 9,5

Стандартне відхилення класу 1 також значно вище:

  • Стандартне відхилення 1 класу: 10,21
  • Стандартне відхилення класу 2: 6,43

Кожен із цих показників говорить нам про те, що розрив в іспитових балах для учнів 1-го класу набагато вищий, ніж для 2-го класу.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в Excel:

Як створити зведену таблицю в Excel
Як обчислити медіану по групах в Excel
Як обчислити стандартне відхилення та ігнорувати нуль у Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *