Что такое выборка латинского гиперкуба?
Выборка в латинском гиперкубе — это метод, который можно использовать для выборки случайных чисел, при котором выборки равномерно распределены по выборочному пространству.
Он широко используется для создания выборок, называемых контролируемыми случайными выборками , и часто применяется в анализе Монте-Карло, поскольку позволяет значительно сократить количество симуляций, необходимых для получения точных результатов.
Образец введения
Чтобы понять идею выборки латинского гиперкуба, рассмотрим следующий простой пример:
Предположим, мы хотим получить выборку из 2 значений из нормально распределенного набора данных со средним значением 0 и стандартным отклонением 1.
Если бы мы использовали настоящий генератор случайных чисел для получения этой выборки, возможно, что оба значения больше 0 или оба значения меньше 0.
Однако если бы мы использовали выборку латинского гиперкуба для получения этой выборки, то было бы гарантировано, что одно значение будет больше 0, а другое меньше 0, поскольку мы могли бы специально разделить пространство выборки на область со значениями больше 0. и регион со значениями меньше 0, затем выберите случайную выборку из каждого региона.
Выборка одномерного латинского гиперкуба
Идея одномерной выборки в латинском гиперкубе проста: разделите заданный CDF на n различных регионов и случайным образом выберите значение в каждом регионе, чтобы получить выборку размера n .
Преимущество этого подхода заключается в том, что он гарантирует включение в выборку хотя бы одного значения из каждого региона.
Выборка двумерных латинских гиперкубов
Мы можем легко распространить идею одномерной выборки латинского гиперкуба и на два измерения.
Для двух переменных, x и y, мы можем разделить пространство выборки каждой переменной на n равномерно расположенных областей и выбрать случайную выборку из каждого пространства выборки, чтобы получить случайные значения в двух измерениях.
Важно отметить, что для достижения желаемых результатов эти две переменные должны быть независимыми.
Выборка N-мерного латинского гиперкуба
Чтобы выполнить выборку латинского гиперкуба в более крупных измерениях, мы можем просто расширить идею двумерной выборки латинского гиперкуба на еще большее количество измерений.
Каждая переменная просто делится на равномерно расположенные области, а затем из каждой области выбираются случайные выборки для получения контролируемой случайной выборки.
Связанный: Что такое многомерные данные?
Зачем использовать выборку Latin Hypercube?
Основное преимущество выборки в латинском гиперкубе состоит в том, что она создает выборки, которые отражают истинное основное распределение и, как правило, требуют гораздо меньших размеров выборки, чем простая случайная выборка .
Этот метод выборки может быть особенно полезен, если вы работаете с данными с большим количеством измерений и вам необходимо получить случайные выборки, которые обязательно отражают истинное основное распределение данных.