Что такое связанные данные? (объяснение и примеры)
Когда два набора данных имеют одинаковую длину и каждое наблюдение из одного набора данных может быть «сопряжено» с наблюдением из другого набора данных, мы называем это парными данными .
Для связи двух наборов данных важно, чтобы каждое наблюдение из одного набора данных могло быть связано только с одним наблюдением из другого набора данных.
Примеры сопоставленных данных
Вот несколько примеров сопоставленных данных:
Пример 1: Повторяющиеся измерения.
Предположим, исследователи хотят знать, способны ли весы взвешивать коробки в любое время дня на данном складе. Чтобы проверить это, исследователи взвешивают на весах 30 разных коробок утром, а затем вечером.
Конечным результатом являются два набора данных, в которых утренние и вечерние веса каждого ящика могут быть «сопоставлены» друг с другом.
Пример 2: измерения до и после.
Врач хочет знать, может ли новый препарат снизить кровяное давление пациентов. Чтобы проверить это, он измерил артериальное давление 20 разных пациентов до и после приема препарата в течение недели.
Конечным результатом являются два набора данных, в которых артериальное давление до и после каждого человека может быть «сопоставлено» само с собой.
Как анализировать парные данные
Существует два распространенных способа анализа парных данных:
1. Выполните парный t-тест.
Одним из способов анализа парных данных является выполнение t-теста для парных выборок , который сравнивает средние значения двух выборок , когда каждое наблюдение из одной выборки может быть сопоставлено с наблюдением из другой выборки.
Этот тест сообщает нам, равно ли среднее значение между двумя наборами данных.
2. Рассчитайте корреляцию между двумя наборами данных.
Другой способ анализа парных данных — вычислить корреляцию между двумя наборами данных.
Это дает нам представление о направлении и силе связи между значениями двух наборов данных.
Парные данные и несовпадающие данные
В отличие от парных данных, непарные данные возникают, когда наблюдения из одного набора данных не могут быть однозначно связаны с наблюдениями из другого набора данных.
Например, предположим, что исследователи хотят знать, увеличивает ли определенная программа тренировок средний вертикальный прыжок баскетболистов.
Один из способов проверить это с использованием сопоставленных данных — измерить максимальный вертикальный прыжок одних и тех же 20 игроков до и после использования тренировочной программы:
Чтобы проверить это, используя непарные данные , исследователи смогли измерить максимальный вертикальный прыжок у 20 игроков, которые не использовали тренировочную программу, а затем измерить максимальный вертикальный прыжок у 20 разных игроков, которые использовали тренировочную программу. ‘обучение:
При работе с парными данными мы используем t-критерий для парных выборок , чтобы определить, отличается ли разница между средними значениями выборки.
А когда мы работаем с непарными данными, мы используем t-критерий независимых выборок , чтобы определить, отличается ли разница между средними значениями выборки.