Що таке латинська вибірка hypercube?
Вибірка латинського гіперкуба — це метод, який можна використовувати для вибірки випадкових чисел, у якому вибірки рівномірно розподілені в просторі вибірки.
Він широко використовується для створення зразків, які називаються контрольованими випадковими зразками , і часто застосовується в аналізі Монте-Карло, оскільки він може значно зменшити кількість симуляцій, необхідних для отримання точних результатів.
Зразок вступу
Щоб зрозуміти ідею латинського гіперкуба, розглянемо наступний простий приклад:
Припустимо, ми хочемо отримати вибірку з 2 значень із нормально розподіленого набору даних із середнім значенням 0 і стандартним відхиленням 1.
Якщо ми використовували справжній генератор випадкових чисел для отримання цієї вибірки, можливо, що обидва значення будуть більшими за 0 або обидва значення будуть меншими за 0.
Однак, якби ми використовували вибірку латинського гіперкуба для отримання цієї вибірки, тоді було б гарантовано, що одне значення буде більше 0, а інше менше 0, тому що ми могли б спеціально розділити простір вибірки на область зі значеннями більше 0 і область зі значеннями менше 0, потім виберіть випадкову вибірку з кожної області.
Одновимірна вибірка латинського гіперкуба
Ідея одновимірної вибірки латинського гіперкуба проста: розділіть задану CDF на n різних областей і випадковим чином виберіть значення в кожній області, щоб отримати вибірку розміром n .
Перевага цього підходу полягає в тому, що він гарантує, що принаймні одне значення з кожного регіону включено до вибірки.
Вибірка двовимірних латинських гіперкубів
Ми можемо легко розширити ідею одновимірної вибірки латинського гіперкуба також до двох вимірів.
Для двох змінних, x і y, ми можемо розділити простір вибірки кожної змінної на n рівномірно розташованих областей і вибрати випадкову вибірку з кожного простору вибірки, щоб отримати випадкові значення у двох вимірах.
Важливо відзначити, що дві змінні мають бути незалежними, щоб ця методика вибірки досягла бажаних результатів.
Вибірка N-вимірного латинського гіперкуба
Щоб виконати вибірку латинського гіперкуба у більших розмірах, ми можемо просто розширити ідею двовимірної вибірки латинського гіперкуба на ще більше вимірювань.
Кожна змінна просто ділиться на рівномірно розташовані області, а потім з кожної області вибираються випадкові зразки, щоб отримати контрольовану випадкову вибірку.
Пов’язане: що таке багатовимірні дані?
Навіщо використовувати вибірку Latin Hypercube?
Основна перевага вибірки латинського гіперкубу полягає в тому, що вона дає вибірки, які відображають справжній основний розподіл і, як правило, вимагають набагато менших розмірів вибірки, ніж проста випадкова вибірка .
Цей метод вибірки може бути особливо корисним, якщо ви працюєте з даними з великою кількістю вимірів і вам потрібно отримати випадкові вибірки, які обов’язково відображатимуть справжній основний розподіл даних.