Co to jest próbkowanie łacińskiego hypercube?
Próbkowanie metodą łacińskiego hipersześcianu to metoda, którą można zastosować do próbkowania liczb losowych, w których próbki są równomiernie rozmieszczone w przestrzeni próbki.
Jest szeroko stosowana do generowania próbek zwanych kontrolowanymi próbkami losowymi i często stosowana w analizie Monte Carlo, ponieważ może znacznie zmniejszyć liczbę symulacji potrzebnych do uzyskania dokładnych wyników.
Przykładowe wprowadzenie
Aby zrozumieć ideę próbkowania łacińskiego hipersześcianu, rozważ następujący prosty przykład:
Załóżmy, że chcemy uzyskać próbkę 2 wartości ze zbioru danych o rozkładzie normalnym ze średnią 0 i odchyleniem standardowym 1.
Jeśli do uzyskania tej próbki użyliśmy prawdziwego generatora liczb losowych, możliwe jest, że obie wartości są większe niż 0 lub obie wartości są mniejsze niż 0.
Jeśli jednak do uzyskania tej próbki użylibyśmy łacińskiego próbkowania hipersześcianu, wówczas byłoby zagwarantowane, że jedna wartość będzie większa niż 0, a druga mniejsza niż 0, ponieważ moglibyśmy konkretnie podzielić przestrzeń próbki na obszar o wartościach większych niż 0 i region o wartościach mniejszych niż 0, następnie wybierz losową próbkę z każdego regionu.
Jednowymiarowe próbkowanie hipersześcianu łacińskiego
Idea jednowymiarowego próbkowania hipersześcianu łacińskiego jest prosta: podziel daną CDF na n różnych regionów i losowo wybierz wartość w każdym regionie, aby otrzymać próbkę o rozmiarze n .
Zaletą tego podejścia jest zapewnienie, że w próbie znajdzie się co najmniej jedna wartość z każdego regionu.
Próbkowanie dwuwymiarowych hipersześcianów łacińskich
Możemy łatwo rozszerzyć ideę jednowymiarowego próbkowania hipersześcianu łacińskiego również na dwa wymiary.
W przypadku dwóch zmiennych x i y możemy podzielić przestrzeń próbną każdej zmiennej na n równomiernie rozmieszczonych obszarów i wybrać losową próbkę z każdej przestrzeni próbnej, aby uzyskać losowe wartości w dwóch wymiarach.
Należy zauważyć, że aby ta technika pobierania próbek pozwoliła osiągnąć pożądane wyniki, obie zmienne muszą być niezależne.
N-wymiarowe próbkowanie hipersześcianu łacińskiego
Aby wykonać próbkowanie łacińskiej hipersześcianu w większych wymiarach, możemy po prostu rozszerzyć ideę dwuwymiarowego próbkowania łacińskiej hipersześcianu na jeszcze więcej wymiarów.
Każdą zmienną dzieli się po prostu na równomiernie rozmieszczone obszary, a następnie z każdego regionu wybiera się losowe próbki w celu uzyskania kontrolowanej próbki losowej.
Powiązane: Co to są dane wielowymiarowe?
Dlaczego warto używać próbkowania Latin Hypercube?
Główną zaletą łacińskiego próbkowania w postaci hipersześcianu jest to, że daje próbki odzwierciedlające prawdziwy rozkład bazowy i zwykle wymaga znacznie mniejszych rozmiarów próbek niż proste próbkowanie losowe .
Ta metoda próbkowania może być szczególnie korzystna, jeśli pracujesz z danymi o dużej liczbie wymiarów i chcesz uzyskać próbki losowe, które z pewnością odzwierciedlają prawdziwy rozkład danych.