Що таке однофакторний аналіз? (визначення & #038; приклад)


Термін однофакторний аналіз відноситься до аналізу однієї змінної. Ви можете запам’ятати це, оскільки префікс «uni» означає «один».

Метою однофакторного аналізу є розуміння розподілу значень однієї змінної. Ви можете порівняти цей тип аналізу з наступним:

Наприклад, припустимо, що ми маємо такий набір даних:

Ми можемо вибрати однофакторний аналіз однієї з окремих змінних у наборі даних, щоб краще зрозуміти розподіл значень.

Наприклад, ми можемо вибрати виконання однофакторного аналізу змінної Розмір домогосподарства :

Приклад однофакторного аналізу

Є три поширені способи виконання однофакторного аналізу:

1. Зведена статистика

Найпоширенішим способом виконання однофакторного аналізу є опис змінної за допомогою підсумкової статистики .

Існує два поширених типи зведеної статистики:

  • Показники центральної тенденції : ці числа описують, де знаходиться центр набору даних. Приклади включають середнє значення та медіану .
  • Міри дисперсії : ці числа описують розподіл значень у наборі даних. Приклади включають інтервал , інтерквартильний діапазон , стандартне відхилення та дисперсію .

2. Частотні розподіли

Інший спосіб виконання однофакторного аналізу – створити частотний розподіл , який описує, як часто різні значення з’являються в наборі даних.

3. Графіка

Інший спосіб виконання однофакторного аналізу – створення графіків для візуалізації розподілу значень для певної змінної.

Загальні приклади:

  • Boxplots
  • Гістограми
  • Криві густини
  • камамбер

У наведених нижче прикладах показано, як виконати кожен тип однофакторного аналізу за допомогою змінної «Розмір домогосподарства » з нашого раніше згаданого набору даних:

Приклад однофакторного аналізу

Зведена статистика

Ми можемо розрахувати наступні показники центральної тенденції розміру домогосподарства:

  • Середнє (середнє значення): 3,8
  • Медіана (середнє значення): 4

Ці значення дають нам уявлення про те, де знаходиться «центральна» цінність.

Ми також можемо розрахувати такі міри дисперсії:

  • Діапазон (різниця між макс. і мін.): 6
  • Інтерквартильна шкала (розподіл середніх 50% значень): 2,5
  • Стандартне відхилення (середній показник поширення): 1,87

Ці значення дають нам уявлення про розподіл значень цієї змінної.

Розподіл частоти

Ми також можемо створити наступну таблицю розподілу частот, щоб узагальнити, як часто зустрічаються різні значення:

Це дозволяє нам швидко побачити, що найпоширеніший розмір домогосподарства становить 4 особи .

Ресурс: Ви можете використовувати цей калькулятор частоти для автоматичного створення частотного розподілу для будь-якої змінної.

Графіка

Ми можемо створити такі графіки, які допоможуть нам візуалізувати розподіл значень розміру домогосподарства:

1. Боксплот

Коробковий графік – це графік, який показує п’ятизначний підсумок набору даних.

Зведення з п’яти цифр включає:

  • Мінімальне значення
  • Перший квартиль
  • Середнє значення
  • Третій квартиль
  • Максимальне значення

Ось як виглядатиме коробкова діаграма для змінної «Розмір домогосподарства»:

Ресурс: Ви можете використовувати цей генератор boxplot для автоматичного створення boxplot для будь-якої змінної.

2. Гістограма

Гістограма — це тип діаграми, який використовує вертикальні стовпчики для відображення частот. Цей тип діаграми є корисним способом візуалізації розподілу значень у наборі даних.

Ось як виглядатиме гістограма для змінної «Розмір домогосподарства»:

3. Крива щільності

Крива щільності — це крива на графіку, яка представляє розподіл значень у наборі даних.

Це особливо корисно для візуалізації «форми» розподілу, включно з тим, чи має розподіл один або кілька «піків» частих значень і чи є розподіл перекошеним вліво або вправо .

Ось як виглядала б крива щільності для змінної розміру домогосподарства:

4. Кругова діаграма

Кругова діаграма — це тип діаграми у формі кола, у якій використовуються зрізи для відображення пропорцій цілого.

Ось як виглядатиме секторна діаграма для змінної «Розмір домогосподарства»:

Залежно від типу даних одна з цих діаграм може бути кориснішою за інші для візуалізації розподілу значень.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *