Что такое выборка латинского гиперкуба?


Выборка в латинском гиперкубе — это метод, который можно использовать для выборки случайных чисел, при котором выборки равномерно распределены по выборочному пространству.

Он широко используется для создания выборок, называемых контролируемыми случайными выборками , и часто применяется в анализе Монте-Карло, поскольку позволяет значительно сократить количество симуляций, необходимых для получения точных результатов.

Образец введения

Чтобы понять идею выборки латинского гиперкуба, рассмотрим следующий простой пример:

Предположим, мы хотим получить выборку из 2 значений из нормально распределенного набора данных со средним значением 0 и стандартным отклонением 1.

Если бы мы использовали настоящий генератор случайных чисел для получения этой выборки, возможно, что оба значения больше 0 или оба значения меньше 0.

Однако если бы мы использовали выборку латинского гиперкуба для получения этой выборки, то было бы гарантировано, что одно значение будет больше 0, а другое меньше 0, поскольку мы могли бы специально разделить пространство выборки на область со значениями больше 0. и регион со значениями меньше 0, затем выберите случайную выборку из каждого региона.

Выборка одномерного латинского гиперкуба

Идея одномерной выборки в латинском гиперкубе проста: разделите заданный CDF на n различных регионов и случайным образом выберите значение в каждом регионе, чтобы получить выборку размера n .

Пример выборки латинского гиперкуба

Преимущество этого подхода заключается в том, что он гарантирует включение в выборку хотя бы одного значения из каждого региона.

Выборка двумерных латинских гиперкубов

Мы можем легко распространить идею одномерной выборки латинского гиперкуба и на два измерения.

Для двух переменных, x и y, мы можем разделить пространство выборки каждой переменной на n равномерно расположенных областей и выбрать случайную выборку из каждого пространства выборки, чтобы получить случайные значения в двух измерениях.

Выборка латинского гиперкуба в двух измерениях

Важно отметить, что для достижения желаемых результатов эти две переменные должны быть независимыми.

Выборка N-мерного латинского гиперкуба

Чтобы выполнить выборку латинского гиперкуба в более крупных измерениях, мы можем просто расширить идею двумерной выборки латинского гиперкуба на еще большее количество измерений.

Каждая переменная просто делится на равномерно расположенные области, а затем из каждой области выбираются случайные выборки для получения контролируемой случайной выборки.

Связанный: Что такое многомерные данные?

Зачем использовать выборку Latin Hypercube?

Основное преимущество выборки в латинском гиперкубе состоит в том, что она создает выборки, которые отражают истинное основное распределение и, как правило, требуют гораздо меньших размеров выборки, чем простая случайная выборка .

Этот метод выборки может быть особенно полезен, если вы работаете с данными с большим количеством измерений и вам необходимо получить случайные выборки, которые обязательно отражают истинное основное распределение данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *