Co to jest rozkład kategoryczny?


Rozkład kategoryczny to dyskretny rozkład prawdopodobieństwa, który opisuje prawdopodobieństwo, że zmienna losowa przyjmie wartość należącą do jednej z K kategorii, gdzie każda kategoria jest powiązana z prawdopodobieństwem.

Aby rozkład mógł zostać zaklasyfikowany jako rozkład kategoryczny, musi spełniać następujące kryteria:

  • Kategorie są dyskretne.
  • Istnieją dwie lub więcej potencjalnych kategorii.
  • Prawdopodobieństwo, że zmienna losowa przyjmie wartość w każdej kategorii, musi mieścić się w przedziale od 0 do 1.
  • Suma prawdopodobieństw wszystkich kategorii musi wynosić 1.

Najbardziej oczywistym przykładem rozkładu kategorycznego jest rozkład wyników związanych z rzutem kostką. Istnieje K = 6 potencjalnych wyników, a prawdopodobieństwo każdego wyniku wynosi 1/6:

Przykład rozkładu kategorycznego

Rozkład ten spełnia wszystkie kryteria, aby można go było zaliczyć do rozkładu kategorycznego:

  • Kategorie są dyskretne (np. zmienna losowa może przyjmować tylko wartości dyskretne – 1, 2, 3, 4, 5, 6)
  • Istnieją dwie lub więcej potencjalnych kategorii.
  • Prawdopodobieństwo każdej kategorii wynosi od 0 do 1.
  • Suma prawdopodobieństw wynosi 1: 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.

Główna zasada:

Jeśli możesz policzyć liczbę wyników, to pracujesz z dyskretną zmienną losową – na przykład licząc, ile razy moneta wypadnie reszką.

Ale jeśli możesz zmierzyć wynik, pracujesz z ciągłą zmienną losową – na przykład mierząc wzrost, wagę, czas itp.

Inne przykłady rozkładów kategorycznych

W świecie rzeczywistym istnieje wiele rozkładów kategorycznych, w tym:

Przykład 1: Rzuć monetą.

Kiedy rzucamy monetą, istnieją 2 potencjalne, dyskretne wyniki, prawdopodobieństwo każdego wyniku wynosi od 0 do 1, a suma prawdopodobieństw jest równa 1:

Przykład rozkładu kategorycznego

Przykład 2: Wybór kulek w urnie.

Załóżmy, że w urnie znajduje się 5 czerwonych kulek, 3 zielone kulki i 2 fioletowe kulki. Jeśli losowo wybierzemy kulę z urny, istnieją 3 potencjalne dyskretne wyniki, prawdopodobieństwo każdego wyniku wynosi od 0 do 1, a suma prawdopodobieństw wynosi 1:

Prawdopodobieństwa rozkładu kategorycznego

Przykład 3: Wybieranie karty z talii.

Jeśli losowo wybierzemy kartę ze standardowej talii 52 kart, istnieje 13 potencjalnych odrębnych wyników, prawdopodobieństwo każdego wyniku wynosi od 0 do 1, a suma prawdopodobieństw wynosi 1:

Związek z innymi dystrybucjami

Aby rozkład można było sklasyfikować jako rozkład kategoryczny , musi mieć K ≥ 2 potencjalnych wyników i n = 1 próbę.

Używając tej terminologii, rozkład kategoryczny jest podobny do następujących rozkładów:

Rozkład Bernoulliego: K = 2 wyniki, n = 1 test

Rozkład dwumianowy: K = 2 punkty końcowe, n ≥ 1 próba

Rozkład wielomianowy: K ≥ 2 wyniki, n ≥ próba

Dodatkowe zasoby

Co to są zmienne losowe?
Wprowadzenie do rozkładu dwumianowego
Wprowadzenie do rozkładu wielomianowego

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *