Що таке латинська вибірка hypercube?


Вибірка латинського гіперкуба — це метод, який можна використовувати для вибірки випадкових чисел, у якому вибірки рівномірно розподілені в просторі вибірки.

Він широко використовується для створення зразків, які називаються контрольованими випадковими зразками , і часто застосовується в аналізі Монте-Карло, оскільки він може значно зменшити кількість симуляцій, необхідних для отримання точних результатів.

Зразок вступу

Щоб зрозуміти ідею латинського гіперкуба, розглянемо наступний простий приклад:

Припустимо, ми хочемо отримати вибірку з 2 значень із нормально розподіленого набору даних із середнім значенням 0 і стандартним відхиленням 1.

Якщо ми використовували справжній генератор випадкових чисел для отримання цієї вибірки, можливо, що обидва значення будуть більшими за 0 або обидва значення будуть меншими за 0.

Однак, якби ми використовували вибірку латинського гіперкуба для отримання цієї вибірки, тоді було б гарантовано, що одне значення буде більше 0, а інше менше 0, тому що ми могли б спеціально розділити простір вибірки на область зі значеннями більше 0 і область зі значеннями менше 0, потім виберіть випадкову вибірку з кожної області.

Одновимірна вибірка латинського гіперкуба

Ідея одновимірної вибірки латинського гіперкуба проста: розділіть задану CDF на n різних областей і випадковим чином виберіть значення в кожній області, щоб отримати вибірку розміром n .

Приклад вибірки латинського гіперкуба

Перевага цього підходу полягає в тому, що він гарантує, що принаймні одне значення з кожного регіону включено до вибірки.

Вибірка двовимірних латинських гіперкубів

Ми можемо легко розширити ідею одновимірної вибірки латинського гіперкуба також до двох вимірів.

Для двох змінних, x і y, ми можемо розділити простір вибірки кожної змінної на n рівномірно розташованих областей і вибрати випадкову вибірку з кожного простору вибірки, щоб отримати випадкові значення у двох вимірах.

Вибірка латинського гіперкуба у двох вимірах

Важливо відзначити, що дві змінні мають бути незалежними, щоб ця методика вибірки досягла бажаних результатів.

Вибірка N-вимірного латинського гіперкуба

Щоб виконати вибірку латинського гіперкуба у більших розмірах, ми можемо просто розширити ідею двовимірної вибірки латинського гіперкуба на ще більше вимірювань.

Кожна змінна просто ділиться на рівномірно розташовані області, а потім з кожної області вибираються випадкові зразки, щоб отримати контрольовану випадкову вибірку.

Пов’язане: що таке багатовимірні дані?

Навіщо використовувати вибірку Latin Hypercube?

Основна перевага вибірки латинського гіперкубу полягає в тому, що вона дає вибірки, які відображають справжній основний розподіл і, як правило, вимагають набагато менших розмірів вибірки, ніж проста випадкова вибірка .

Цей метод вибірки може бути особливо корисним, якщо ви працюєте з даними з великою кількістю вимірів і вам потрібно отримати випадкові вибірки, які обов’язково відображатимуть справжній основний розподіл даних.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *