Cdf чи pdf: у чому різниця?
Цей підручник містить просте пояснення різниці між PDF (функцією щільності ймовірності) і CDF (інтегральною функцією розподілу) у статистиці.
Випадкові величини
Перш ніж ми зможемо визначити PDF або CDF, нам спочатку потрібно зрозуміти випадкові змінні.
Випадкова величина , зазвичай позначається X, – це змінна, значення якої є числовими результатами випадкового процесу. Випадкові величини бувають двох типів: дискретні та неперервні.
Дискретні випадкові величини
Дискретна випадкова змінна — це змінна, яка може приймати лише лічильну кількість різних значень, наприклад 0, 1, 2, 3, 4, 5… 100, 1 мільйон тощо. Ось кілька прикладів дискретних випадкових величин:
- Кількість разів, коли монета потрапляє в решку після 20 підкидань.
- Кількість разів, коли кубик потрапляє на число 4 після 100 кидків.
Безперервні випадкові величини
Безперервна випадкова величина – це змінна, яка може приймати нескінченну кількість можливих значень. Ось кілька прикладів безперервних випадкових величин:
- Зріст людини
- Вага тварини
- Час, витрачений на проходження милі
Наприклад, зріст людини може становити 60,2 дюйма, 65,2344 дюйма, 70,431222 дюйма тощо. Існує нескінченна кількість можливих значень розміру.
Загальне емпіричне правило: якщо ви можете підрахувати кількість результатів, ви працюєте з дискретною випадковою змінною (наприклад, підраховуєте кількість разів, коли монета випадає головами). Але якщо ви можете виміряти результат, ви працюєте з безперервною випадковою змінною (наприклад, вимірювання, зріст, вага, час тощо).
Функції щільності ймовірності
Функція щільності ймовірності (pdf) повідомляє нам про ймовірність того, що випадкова змінна набуває певного значення.
Наприклад, припустімо, що ми один раз кидаємо кубик. Якщо ми позначимо x число, на яке впав кубик, то функція щільності ймовірності результату може бути описана таким чином:
P(x < 1) : 0
P(x = 1) : 1/6
P(x = 2) : 1/6
P(x = 3) : 1/6
P(x = 4) : 1/6
P(x = 5) : 1/6
P(x = 6) : 1/6
P(x > 6) : 0
Зверніть увагу, що це приклад дискретної випадкової змінної, оскільки x може приймати лише цілі значення.
Для безперервної випадкової змінної ми не можемо безпосередньо використовувати PDF, оскільки ймовірність того, що x приймає точне значення, дорівнює нулю.
Наприклад, припустімо, що ми хочемо знати ймовірність того, що гамбургер із певного ресторану важить чверть фунта (0,25 фунта). Оскільки вага є безперервною змінною, вона може приймати нескінченну кількість значень.
Наприклад, певний гамбургер може важити 0,250001 фунта, або 0,24 фунта, або 0,2488 фунта. Імовірність того, що даний гамбургер важитиме рівно 0,25 фунта, фактично дорівнює нулю.
Кумулятивні функції розподілу
Кумулятивна функція розподілу (cdf) повідомляє нам про ймовірність того, що випадкова змінна приймає значення, менше або дорівнює x .
Наприклад, припустімо, що ми один раз кидаємо кубик. Якщо ми позначимо x число, на яке впав кубик, тоді кумулятивну функцію розподілу результату можна описати таким чином:
P(x ≤ 0) : 0
P(x ≤ 1) : 1/6
P(x ≤ 2) : 2/6
P(x ≤ 3) : 3/6
P(x ≤ 4) : 4/6
P(x ≤ 5) : 5/6
P(x ≤ 6) : 6/6
P(x > 6) : 0
Зауважте, що ймовірність того, що x буде меншим або дорівнює 6 , дорівнює 6/6, що дорівнює 1. Це тому, що кубики впадуть на 1, 2, 3, 4, 5 або 6 із 100% ймовірністю.
У цьому прикладі використовується дискретна випадкова змінна, але функція безперервної щільності також може використовуватися для безперервної випадкової змінної.
Кумулятивні функції розподілу мають такі властивості:
- Імовірність того, що випадкова величина приймає значення, менше найменшого можливого значення, дорівнює нулю. Наприклад, ймовірність того, що кубик впаде на значення менше 1, дорівнює нулю.
- Ймовірність того, що випадкова величина приймає значення, менше або рівне найбільшому можливому значенню, дорівнює одиниці. Наприклад, ймовірність того, що кубик випаде на значення 1, 2, 3, 4, 5 або 6, дорівнює одиниці. Він повинен припасти на одне з цих чисел.
- Cdf завжди не спадає. Тобто ймовірність того, що кубик випаде на число, менше або дорівнює 1, дорівнює 1/6, ймовірність того, що він випаде на число, менше або дорівнює 2, дорівнює 2/6, імовірність випадіння на число менше або дорівнює 3 дорівнює 3/6 тощо. Кумулятивні ймовірності завжди не спадають.
Пов’язане: Ви можете використовувати діаграму ogive , щоб візуалізувати кумулятивну функцію розподілу.
Зв’язок між CDF і PDF
Технічною мовою функція щільності ймовірності (pdf) є похідною від інтегральної функції розподілу (cdf).
Крім того, площа під кривою pdf між негативною нескінченністю та x дорівнює значенню x у cdf.
Щоб отримати докладне пояснення зв’язку між pdf і cdf, а також доказ того, чому pdf є похідною від cdf, зверніться до підручника статистики.