Чому статистика важлива? (10 причин, чому статистика важлива!)
Сфера статистики займається збором, аналізом, інтерпретацією та представленням даних.
У міру того, як технології все більше і більше входять у наше повсякденне життя, генерується та збирається більше даних, ніж будь-коли в історії людства.
Статистика – це область, яка може допомогти нам зрозуміти, як використовувати ці дані для виконання таких завдань:
- Краще розуміти світ навколо нас.
- Приймайте рішення за допомогою даних.
- Робіть прогнози щодо майбутнього за допомогою даних.
У цій статті ми поділимося 10 причинами, чому сфера статистики є такою важливою в сучасному житті.
Причина 1: використовуйте описову статистику, щоб зрозуміти світ
Описова статистика використовується для опису необроблених даних. Існує три основних типи описової статистики:
- Зведена статистика
- Графіка
- таблиці
Кожен із цих елементів може допомогти нам краще зрозуміти наявні дані.
Наприклад, скажімо, у нас є набір необроблених даних, що показує результати тестів 10 000 студентів у певному місті. Ми можемо використовувати описову статистику, щоб:
- Обчислити середній тестовий бал і стандартне відхилення результатів тесту.
- Створіть гістограму або коробковий графік, щоб візуалізувати розподіл результатів тесту.
- Створіть частотну таблицю, щоб зрозуміти розподіл результатів тесту.
Використовуючи описову статистику, ми можемо зрозуміти результати тестів студентів набагато легше, ніж просто дивитися на необроблені дані.
Причина 2: остерігайтеся оманливої графіки
У журналах, ЗМІ, онлайн-статтях і журналах створюється все більше і більше графіки. На жаль, діаграми часто можуть вводити в оману, якщо ви не розумієте основні дані.
Наприклад, припустімо, що журнал публікує дослідження, яке виявляє негативну кореляцію між балами GPA та ACT студентів певного університету.
Однак ця негативна кореляція виникає лише тому, що студенти, які мають як високий GPA, так і ACT, можуть навчатися в елітному університеті, тоді як студенти, які мають низький GPA та ACT, не приймаються взагалі.
Хоча кореляція між ACT і GPA позитивна в популяції, кореляція виглядає негативною у вибірці.
Це особливе упередження відоме як упередження Берксона . Усвідомлюючи цю упередженість, ви можете уникнути введення в оману певними діаграмами.
Причина 3: остерігайтеся плутати змінні
Важливим поняттям, про яке ви дізнаєтесь у статистиці, є поняття плутанини змінних .
Це змінні, які не враховуються і можуть спотворити результати експерименту та призвести до недостовірних висновків.
Наприклад, припустимо, що дослідник збирає дані про продаж морозива та напади акул і виявляє, що ці дві змінні сильно корелюють. Чи означає це, що збільшення продажів морозива спричиняє більше нападів акул?
Це малоймовірно. Найімовірнішою причиною є незрозуміла змінна температура . Коли на вулиці тепліше, більше людей купують морозиво і більше людей їдуть до океану.
Причина 4: приймати кращі рішення, використовуючи ймовірності
Однією з найважливіших підгалузей статистики є ймовірність . Це область, яка вивчає ймовірність подій, що відбуваються.
Маючи базове розуміння ймовірності, ви можете приймати більш обґрунтовані рішення в реальному світі.
Наприклад, припустимо, що старшокласник знає, що у нього є 10% шансів бути прийнятим до даного університету. Використовуючи формулу для ймовірності здачі «хоча б один» , цей студент може знайти ймовірність того, що його приймуть принаймні до одного університету, до якого він подає заяву, і може регулювати кількість університетів, до яких він подає документи за результатом.
Причина 5: Розуміння P-значень у дослідженнях
Ще одна важлива концепція, про яку ви дізнаєтесь у статистиці, — це p-значення .
Класичне визначення p-значення:
P-значення — це ймовірність спостереження статистичних даних вибірки, яка є принаймні такою ж екстремальною, як статистика вашої вибірки, враховуючи, що нульова гіпотеза вірна.
Наприклад, припустімо, що фабрика стверджує, що виробляє шини середньою вагою 200 фунтів. Аудитор припускає, що фактична середня вага шин, вироблених на цьому заводі, відрізняється на 200 фунтів. Тож він виконує перевірку гіпотези та виявляє, що p-значення тесту становить 0,04.
Ось як інтерпретувати це p-значення:
Якщо фабрика справді виробляє шини із середньою вагою 200 фунтів, то 4% усіх аудитів досягнуть ефекту, який спостерігається у вибірці, або більше через помилку випадкової вибірки. Це говорить нам про те, що отримання зразків даних, отриманих аудитором, було б досить рідкісним явищем, якби фабрика справді виробляла шини із середньою вагою 200 фунтів.
Таким чином, аудитор, швидше за все, відхилив би нульову гіпотезу про те, що фактична середня вага шин, вироблених на цьому заводі, справді становить 200 фунтів.
Причина 6: Зрозумійте кореляцію
Ще одна важлива концепція, про яку ви дізнаєтесь у статистиці, — це кореляція , яка повідомляє нам про лінійний зв’язок між двома змінними.
Значення коефіцієнта кореляції завжди між -1 і 1, де:
- -1 вказує на абсолютно негативну лінійну кореляцію між двома змінними
- 0 означає відсутність лінійної кореляції між двома змінними
- 1 вказує на абсолютно позитивну лінійну кореляцію між двома змінними
Розуміючи ці значення, ви можете зрозуміти зв’язок між змінними в реальному світі.
Наприклад, якщо кореляція між витратами на рекламу та доходом становить 0,87, ви можете зрозуміти, що між двома змінними існує сильний позитивний зв’язок. Оскільки ви витрачаєте більше грошей на рекламу, ви можете очікувати передбачуваного збільшення доходу.
Причина 7: Робіть прогнози щодо майбутнього
Ще одна важлива причина вивчення статистики — це розуміння базових моделей регресії, таких як:
Кожна з цих моделей дозволяє робити прогнози щодо майбутнього значення змінної відповіді на основі значення певних змінних предиктора в моделі.
Наприклад, компанії постійно використовують множинні моделі лінійної регресії в реальному світі, використовуючи передбачувані змінні, такі як вік, дохід, етнічна приналежність тощо. щоб передбачити, скільки клієнтів витратить у їхніх магазинах.
Так само логістичні компанії використовують такі прогнозні змінні, як загальний попит, чисельність населення тощо. прогнозувати майбутні продажі.
Незалежно від того, в якій сфері ви працюєте, існує велика ймовірність того, що регресійні моделі використовуються для прогнозування майбутнього явища.
Причина 8: Зрозумійте потенційну упередженість у дослідженнях
Ще одна причина для вивчення статистики полягає в тому, щоб знати про всі різні типи упереджень, які можуть виникнути в реальних дослідженнях.
Ось кілька прикладів:
- Дотримуйтесь упередженості
- Упередженість самостійного вибору
- Еталонне зміщення
- Пропущене змінне зміщення
- Упередженість підрахунку
- Упередженість відсутності відповіді
Маючи базове розуміння цих типів упереджень, ви можете уникнути їх під час проведення досліджень або знати про них, читаючи інші дослідницькі статті чи дослідження.
Причина 9: Розумійте припущення, зроблені статистичними тестами
Багато статистичних тестів роблять припущення щодо базових даних, що вивчаються.
Читаючи результати дослідження або навіть проводячи власне дослідження, важливо розуміти, які припущення потрібно зробити, щоб результати були надійними.
У наступних статтях поділяються припущення, зроблені в багатьох широко використовуваних статистичних тестах і процедурах:
- Що таке припущення рівної дисперсії в статистиці?
- Що таке припущення нормальності в статистиці?
- Що таке припущення незалежності в статистиці?
Причина 10: Щоб уникнути надмірного узагальнення
Ще одна причина для вивчення статистики полягає в тому, щоб зрозуміти концепцію надмірного узагальнення .
Це відбувається, коли особи, які беруть участь у дослідженні, не є представниками загальної популяції, і тому недоцільно узагальнювати результати дослідження на всю популяцію.
Наприклад, скажімо, ми хочемо знати, який відсоток учнів у певній школі віддає перевагу «драмі» як своєму улюбленому жанру фільму. Якщо загальна кількість студентів складається з 50% хлопців і 50% дівчат, тоді вибірка, що складається з 90% хлопців і 10% дівчат, може призвести до необ’єктивних результатів, якщо значно менше хлопців віддають перевагу театру як улюбленому жанру.
В ідеалі ми хочемо, щоб наша вибірка нагадувала «міні-версію» нашої сукупності. Таким чином, якщо загальна кількість студентів складається з 50% дівчат і 50% хлопців, наша вибірка не буде репрезентативною, якщо вона включатиме 90% хлопців і лише 10% дівчат.
Отже, незалежно від того, проводите ви власне опитування чи читаєте результати опитування, важливо розуміти, чи дані вибірки репрезентують загальну сукупність і чи можна результати опитування з упевненістю узагальнити для сукупності.
Додаткові ресурси
Ознайомтеся з наведеними нижче статтями, щоб отримати базове розуміння найважливіших понять у вступній статистиці:
Описова або інференційна статистика
Населення проти зразок
Статистика проти параметра
Якісні та кількісні змінні
Рівні вимірювання: номінальний, порядковий, інтервальний та коефіцієнтний