Co to jest próbkowanie łacińskiego hypercube?

Przez Benjamin Anderson 28 lipca, 2023 Przewodnik 0 komentarzy

Próbkowanie metodą łacińskiego hipersześcianu to metoda, którą można zastosować do próbkowania liczb losowych, w których próbki są równomiernie rozmieszczone w przestrzeni próbki.

Jest szeroko stosowana do generowania próbek zwanych kontrolowanymi próbkami losowymi i często stosowana w analizie Monte Carlo, ponieważ może znacznie zmniejszyć liczbę symulacji potrzebnych do uzyskania dokładnych wyników.

Przykładowe wprowadzenie

Aby zrozumieć ideę próbkowania łacińskiego hipersześcianu, rozważ następujący prosty przykład:

Załóżmy, że chcemy uzyskać próbkę 2 wartości ze zbioru danych o rozkładzie normalnym ze średnią 0 i odchyleniem standardowym 1.

Jeśli do uzyskania tej próbki użyliśmy prawdziwego generatora liczb losowych, możliwe jest, że obie wartości są większe niż 0 lub obie wartości są mniejsze niż 0.

Jeśli jednak do uzyskania tej próbki użylibyśmy łacińskiego próbkowania hipersześcianu, wówczas byłoby zagwarantowane, że jedna wartość będzie większa niż 0, a druga mniejsza niż 0, ponieważ moglibyśmy konkretnie podzielić przestrzeń próbki na obszar o wartościach większych niż 0 i region o wartościach mniejszych niż 0, następnie wybierz losową próbkę z każdego regionu.

Jednowymiarowe próbkowanie hipersześcianu łacińskiego

Idea jednowymiarowego próbkowania hipersześcianu łacińskiego jest prosta: podziel daną CDF na n różnych regionów i losowo wybierz wartość w każdym regionie, aby otrzymać próbkę o rozmiarze n .

Przykład próbkowania łacińskiego hipersześcianu

Zaletą tego podejścia jest zapewnienie, że w próbie znajdzie się co najmniej jedna wartość z każdego regionu.

Próbkowanie dwuwymiarowych hipersześcianów łacińskich

Możemy łatwo rozszerzyć ideę jednowymiarowego próbkowania hipersześcianu łacińskiego również na dwa wymiary.

W przypadku dwóch zmiennych x i y możemy podzielić przestrzeń próbną każdej zmiennej na n równomiernie rozmieszczonych obszarów i wybrać losową próbkę z każdej przestrzeni próbnej, aby uzyskać losowe wartości w dwóch wymiarach.

Próbkowanie łacińskiego hipersześcianu w dwóch wymiarach

Należy zauważyć, że aby ta technika pobierania próbek pozwoliła osiągnąć pożądane wyniki, obie zmienne muszą być niezależne.

N-wymiarowe próbkowanie hipersześcianu łacińskiego

Aby wykonać próbkowanie łacińskiej hipersześcianu w większych wymiarach, możemy po prostu rozszerzyć ideę dwuwymiarowego próbkowania łacińskiej hipersześcianu na jeszcze więcej wymiarów.

Każdą zmienną dzieli się po prostu na równomiernie rozmieszczone obszary, a następnie z każdego regionu wybiera się losowe próbki w celu uzyskania kontrolowanej próbki losowej.

Powiązane: Co to są dane wielowymiarowe?

Dlaczego warto używać próbkowania Latin Hypercube?

Główną zaletą łacińskiego próbkowania w postaci hipersześcianu jest to, że daje próbki odzwierciedlające prawdziwy rozkład bazowy i zwykle wymaga znacznie mniejszych rozmiarów próbek niż proste próbkowanie losowe .

Ta metoda próbkowania może być szczególnie korzystna, jeśli pracujesz z danymi o dużej liczbie wymiarów i chcesz uzyskać próbki losowe, które z pewnością odzwierciedlają prawdziwy rozkład danych.

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej