Розподіл ймовірностей
У цій статті пояснюється, що таке розподіли ймовірностей у статистиці. Отже, ви знайдете визначення розподілу ймовірності, приклади розподілу ймовірності та різні типи розподілу ймовірності.
Що таке розподіл ймовірностей?
Розподіл ймовірностей — це функція, яка визначає ймовірність появи кожного значення випадкової величини . Простіше кажучи, розподіл ймовірностей — це математична функція, яка описує ймовірності всіх можливих результатів випадкового експерименту.
Наприклад, нехай
Тому ймовірнісні розподіли часто використовуються в теорії ймовірностей і статистиці, оскільки вони використовуються для обчислення ймовірностей різних подій у вибірковому просторі .
Типи розподілів ймовірностей
Розподіли ймовірностей можна розділити на два великі типи: дискретні розподіли та безперервні розподіли.
- Дискретний розподіл ймовірностей: розподіл може приймати лише лічильну кількість значень в інтервалі. Зазвичай дискретні розподіли ймовірностей можуть приймати лише цілі значення, тобто вони не мають десяткових знаків.
- Безперервний розподіл ймовірностей: розподіл може приймати нескінченну кількість значень в інтервалі. Загалом, безперервні розподіли ймовірностей можуть приймати десяткові значення.
Дискретні розподіли ймовірностей
Дискретний розподіл ймовірностей — це розподіл, який визначає ймовірності дискретної випадкової величини. Тому дискретний розподіл ймовірностей може приймати лише кінцеву кількість значень (зазвичай це цілі значення).
Дискретний рівномірний розподіл
Дискретний рівномірний розподіл — це дискретний розподіл ймовірностей, у якому всі значення є рівноімовірними, тобто в дискретному рівномірному розподілі всі значення мають однакову ймовірність появи.
Наприклад, кидок кубика можна визначити за допомогою дискретного рівномірного розподілу, оскільки всі можливі результати (1, 2, 3, 4, 5 або 6) мають однакову ймовірність виникнення.
Загалом, дискретний рівномірний розподіл має два характеристичні параметри, a і b , які визначають діапазон можливих значень, які може прийняти розподіл. Таким чином, коли змінна визначається дискретним рівномірним розподілом, вона записується Uniform(a,b) .
Дискретний рівномірний розподіл можна використовувати для опису випадкових експериментів, оскільки якщо всі результати мають однакову ймовірність, це означає, що експеримент є випадковим.
Розподіл Бернуллі
Розподіл Бернуллі , також відомий як дихотомічний розподіл , є розподілом ймовірностей, який представляє дискретну змінну, яка може мати лише два результати: «успіх» або «невдача».
У розподілі Бернуллі «успіх» — це результат, який ми очікуємо, і має значення 1, тоді як результат «невдача» — результат, відмінний від очікуваного, і має значення 0. Отже, якщо ймовірність результату « успіх» дорівнює p , ймовірність результату «невдачі» дорівнює q=1-p .
Розподіл Бернуллі названо на честь швейцарського статистика Якоба Бернуллі.
У статистиці розподіл Бернуллі в основному має одне застосування: визначення ймовірностей експериментів, у яких є лише два можливі результати: успіх і невдача. Отже, експеримент, який використовує розподіл Бернуллі, називається тестом Бернуллі або експериментом Бернуллі.
Біноміальний розподіл
Біноміальний розподіл , який також називають біноміальним розподілом , — це розподіл ймовірностей, який підраховує кількість успіхів під час виконання серії незалежних дихотомічних експериментів із постійною ймовірністю успіху. Іншими словами, біноміальний розподіл — це розподіл, який описує кількість успішних результатів послідовності випробувань Бернуллі.
Наприклад, кількість разів, коли «голови» з’являються під час підкидання монети 25 разів, є біноміальним розподілом.
Загалом, загальна кількість проведених експериментів визначається параметром n , тоді як p є ймовірністю успіху кожного експерименту. Таким чином, випадкова величина, яка слідує за біноміальним розподілом, записується так:
Зверніть увагу, що в біноміальному розподілі той самий експеримент повторюється n разів, і експерименти не залежать один від одного, тому ймовірність успіху кожного експерименту однакова (p) .
Розподіл риби
Розподіл Пуассона — це розподіл ймовірностей, який визначає ймовірність певної кількості подій, що відбуваються протягом певного періоду часу. Іншими словами, розподіл Пуассона використовується для моделювання випадкових змінних, які описують кількість повторень явища в інтервалі часу.
Наприклад, кількість дзвінків, які отримує телефонна станція за хвилину, є дискретною випадковою величиною, яку можна визначити за допомогою розподілу Пуассона.
Розподіл Пуассона має характерний параметр, представлений грецькою літерою λ і вказує кількість разів, коли досліджувана подія, як очікується, відбудеться протягом заданого інтервалу.
мультиноміальний розподіл
Мультиноміальний розподіл (або мультиноміальний розподіл ) — це розподіл ймовірностей, який описує ймовірність кількох взаємовиключних подій, що відбуваються певну кількість разів після кількох випробувань.
Тобто, якщо випадковий експеримент може призвести до трьох або більше ексклюзивних подій і відома ймовірність кожної події окремо, мультиноміальний розподіл використовується для обчислення ймовірності того, що при проведенні кількох експериментів відбудеться певна кількість подій. час кожного разу.
Тому мультиноміальний розподіл є узагальненням біноміального розподілу.
геометричний розподіл
Геометричний розподіл — це розподіл ймовірностей, який визначає кількість проб Бернуллі, необхідних для отримання першого успішного результату. Тобто геометричний розподіл моделює процеси, в яких експерименти Бернуллі повторюються, поки один з них не отримає позитивний результат.
Наприклад, кількість автомобілів, які проїжджають по шосе, поки вони не побачать жовту машину, є геометричним розподілом.
Пам’ятайте, що тест Бернуллі — це експеримент, який має два можливі результати: «успіх» і «невдача». Отже, якщо ймовірність «успіху» дорівнює p , то ймовірність «невдачі» дорівнює q=1-p .
Отже, геометричний розподіл залежить від параметра p , який є ймовірністю успіху всіх проведених експериментів. Крім того, ймовірність p однакова для всіх експериментів.
негативний біноміальний розподіл
Негативний біноміальний розподіл — це розподіл ймовірностей, який описує кількість проб Бернуллі, необхідних для отримання певної кількості позитивних результатів.
Отже, негативний біноміальний розподіл має два характерних параметри: r — кількість бажаних успішних результатів і p — ймовірність успіху для кожного проведеного експерименту Бернуллі.
Таким чином, негативний біноміальний розподіл визначає процес, у якому виконується стільки спроб Бернуллі, скільки необхідно для отримання позитивних результатів . Крім того, усі ці випробування Бернуллі незалежні та мають постійну ймовірність успіху .
Наприклад, випадкова змінна, що слідує за негативним біноміальним розподілом, — це кількість кидків кубика, доки число 6 не буде кинуто тричі.
гіпергеометричний розподіл
Гіпергеометричний розподіл — це розподіл ймовірностей, який описує кількість успішних випадків у випадковому вилученні без заміни n елементів із сукупності.
Тобто гіпергеометричний розподіл використовується для обчислення ймовірності отримання x успіхів при вилученні n елементів із сукупності без заміни жодного з них.
Отже, гіпергеометричний розподіл має три параметри:
- N : кількість елементів у сукупності (N = 0, 1, 2,…).
- K : максимальна кількість успішних випадків (K = 0, 1, 2,…,N). Оскільки в гіпергеометричному розподілі елемент можна вважати лише «успішним» або «невдалим», NK — це максимальна кількість випадків відмови.
- n : це кількість виконаних вибірок без заміни.
Неперервні розподіли ймовірностей
Безперервний розподіл ймовірностей – це такий, який може приймати будь-яке значення в інтервалі, включаючи десяткові значення. Отже, неперервний розподіл ймовірностей визначає ймовірності неперервної випадкової величини.
рівномірний і безперервний розподіл
Безперервний рівномірний розподіл , також званий прямокутним розподілом , є типом безперервного розподілу ймовірностей, у якому всі значення мають однакову ймовірність появи. Іншими словами, неперервний рівномірний розподіл — це розподіл, у якому ймовірність рівномірно розподілена на інтервалі.
Неперервний рівномірний розподіл використовується для опису неперервних змінних, які мають постійну ймовірність. Подібним чином безперервний рівномірний розподіл використовується для визначення випадкових процесів, оскільки якщо всі результати мають однакову ймовірність, це означає, що результат є випадковим.
Неперервний рівномірний розподіл має два характеристичні параметри, a і b , які визначають інтервал рівної ймовірності. Таким чином, символ безперервного рівномірного розподілу – U(a,b) , де a і b – характерні значення розподілу.
Наприклад, якщо результат випадкового експерименту може приймати будь-яке значення від 5 до 9 і всі можливі результати мають однакову ймовірність виникнення, експеримент можна змоделювати з безперервним рівномірним розподілом U(5.9).
Нормальний розподіл
Нормальний розподіл — це безперервний розподіл ймовірностей, графік якого має форму дзвона та симетричний відносно свого середнього. У статистиці нормальний розподіл використовується для моделювання явищ із дуже різними характеристиками, тому цей розподіл такий важливий.
Фактично, у статистиці нормальний розподіл вважається найважливішим розподілом із усіх розподілів ймовірностей, оскільки він не лише може моделювати велику кількість явищ реального світу, але нормальний розподіл також можна використовувати для наближення інших типів розподіли. за певних умов.
Символом нормального розподілу є велика літера N. Отже, щоб вказати, що змінна відповідає нормальному розподілу, вона позначається літерою N, а значення її середнього арифметичного та стандартного відхилення додаються в дужках.
Нормальний розподіл має багато різних назв, включаючи розподіл Гаусса , розподіл Гаусса та розподіл Лапласа-Гаусса .
Логанормальний розподіл
Логарифмічний нормальний розподіл або логарифмічний нормальний розподіл — це розподіл ймовірностей, який визначає випадкову величину, чий логарифм відповідає нормальному розподілу.
Отже, якщо змінна X має нормальний розподіл, то експоненціальна функція e x має логнормальний розподіл.
Зауважте, що логарифмічний нормальний розподіл можна використовувати лише тоді, коли значення змінної додатні, оскільки логарифм — це функція, яка приймає лише один додатний аргумент.
Серед різних застосувань логнормального розподілу в статистиці ми виділяємо використання цього розподілу для аналізу фінансових інвестицій і проведення аналізу надійності.
Логнормальний розподіл також відомий як розподіл Тіно , іноді також записується як логарифмічний нормальний розподіл або логарифмічний нормальний розподіл .
Розподіл хі-квадрат
Розподіл хі-квадрат – це розподіл ймовірностей, символом якого є χ². Точніше, розподіл хі-квадрат — це сума квадратів k незалежних випадкових величин із нормальним розподілом.
Таким чином, розподіл хі-квадрат має k ступенів свободи. Отже, розподіл хі-квадрат має стільки ступенів свободи, скільки сума квадратів змінних із нормальним розподілом, які він представляє.
Розподіл хі-квадрат також відомий як розподіл Пірсона .
Розподіл хі-квадрат широко використовується в статистичних висновках, наприклад, для перевірки гіпотез і довірчих інтервалів. Нижче ми побачимо застосування цього типу розподілу ймовірностей.
Розподіл Стьюдента
Розподіл Стьюдента — це розподіл ймовірностей, який широко використовується в статистиці. Зокрема, t-розподіл Стьюдента використовується в t-критерії Стьюдента для визначення різниці між середніми значеннями двох вибірок і встановлення довірчих інтервалів.
Розподіл Стьюдента був розроблений статистиком Вільямом Сілі Госсетом у 1908 році під псевдонімом «Студент».
Розподіл t Стьюдента визначається кількістю ступенів свободи, отриманим шляхом віднімання однієї одиниці із загальної кількості спостережень. Тому формула для визначення ступенів свободи t-розподілу Стьюдента має вигляд ν=n-1 .
Snedecor F Розповсюдження
F-розподіл Снедекора , також званий F-розподілом Фішера–Снедекора або просто F-розподілом , є безперервним розподілом ймовірностей, який використовується в статистичних висновках, зокрема в дисперсійному аналізі.
Однією з властивостей F-розподілу Снедекора є те, що він визначається значенням двох дійсних параметрів, m і n , які вказують його ступені свободи. Таким чином, символом для розподілу Снедекора F є F m,n , де m і n є параметрами, які визначають розподіл.
Розподіл Фішера-Снедекора F отримав свою назву на честь англійського статистика Рональда Фішера та американського статистика Джорджа Снедекора.
У статистиці F-розподіл Фішера-Снедекора має різні застосування. Наприклад, F-розподіл Фішера-Снедекора використовується для порівняння різних моделей лінійної регресії, а цей розподіл ймовірностей використовується в дисперсійному аналізі (ANOVA).
експоненціальний розподіл
Експоненціальний розподіл — це безперервний розподіл ймовірностей, який використовується для моделювання часу очікування виникнення випадкового явища.
Точніше, експоненціальний розподіл дає змогу описати час очікування між двома явищами, який відповідає розподілу Пуассона. Тому експоненціальний розподіл тісно пов’язаний з розподілом Пуассона.
Експоненціальний розподіл має характерний параметр, представлений грецькою літерою λ, і вказує кількість разів, коли досліджувана подія має відбутися протягом певного періоду часу.
Подібним чином, експоненціальний розподіл також використовується для моделювання часу до появи збою. Отже, експоненціальний розподіл має декілька застосувань у теорії надійності та виживання.
Бета-розповсюдження
Бета-розподіл – це розподіл ймовірностей, визначений в інтервалі (0,1) і параметризований двома позитивними параметрами: α і β. Іншими словами, значення бета-розподілу залежать від параметрів α і β.
Таким чином, бета-розподіл використовується для визначення неперервних випадкових змінних, значення яких знаходиться між 0 і 1.
Існує кілька позначень, які вказують на те, що безперервна випадкова змінна регулюється бета-розподілом, найпоширеніші:
У статистиці бета-розповсюдження має дуже різноманітне застосування. Наприклад, бета-розподіл використовується для вивчення варіацій у відсотках у різних зразках. Так само в управлінні проектами бета-розповсюдження використовується для виконання аналізу Pert.
Гамма-розподіл
Гамма-розподіл — це безперервний розподіл ймовірностей, який визначається двома характерними параметрами, α і λ. Іншими словами, гамма-розподіл залежить від значення двох його параметрів: α — параметр форми та λ — параметр масштабу.
Символом гамма-розподілу є велика грецька літера Γ. Отже, якщо випадкова величина відповідає гамма-розподілу, вона записується так:
Гамма-розподіл також можна параметризувати за допомогою параметра форми k = α та параметра оберненого масштабу θ = 1/λ. У всіх випадках два параметри, які визначають гамма-розподіл, є позитивними дійсними числами.
Як правило, гамма-розподіл використовується для моделювання праворуч викривлених наборів даних, щоб була більша концентрація даних у лівій частині графіка. Наприклад, гамма-розподіл використовується для моделювання надійності електричних компонентів.
Розподіл Вейбулла
Розподіл Вейбулла є безперервним розподілом ймовірностей, який визначається двома характерними параметрами: параметром форми α і параметром масштабу λ.
У статистиці розподіл Вейбулла в основному використовується для аналізу виживання. Подібним чином розподіл Вейбулла має багато застосувань у різних сферах.
На думку авторів, розподіл Вейбулла також можна параметризувати трьома параметрами. Потім додається третій параметр, який називається пороговим значенням, який вказує абсцису, на якій починається графік розподілу.
Розподіл Вейбулла названо на честь шведа Валодді Вейбулла, який детально описав його в 1951 році. Однак розподіл Вейбулла був відкритий Морісом Фреше в 1927 році та вперше застосований Розіном і Раммлером у 1933 році.
Розподіл Парето
Розподіл Парето — безперервний розподіл ймовірностей, який використовується в статистиці для моделювання принципу Парето. Таким чином, розподіл Парето є розподілом ймовірностей, який має кілька значень, ймовірність появи яких набагато вище, ніж інші значення.
Пам’ятайте, що закон Парето, також званий правилом 80-20, є статистичним принципом, який говорить, що більшість причин явища є причиною невеликої частини населення.
Розподіл Парето має два характерних параметри: параметр масштабу x m і параметр форми α.
Спочатку розподіл Парето використовувався для опису розподілу багатства всередині населення, оскільки більша частина його була зумовлена невеликою часткою населення. Але в даний час розподіл Парето має багато застосувань, наприклад, в контролі якості, в економіці, в науці, в соціальній сфері і т.д.