Co to są powiązane dane? (wyjaśnienie i przykłady)


Kiedy dwa zbiory danych mają tę samą długość i każdą obserwację z jednego zbioru danych można „sparować” z obserwacją z innego zbioru danych, nazywamy to sparowanymi danymi .

Sparowane dane

Aby dwa zbiory danych zostały powiązane, ważne jest, aby każda obserwacja z jednego zbioru danych mogła być powiązana tylko z jedną obserwacją z drugiego zbioru danych.

Przykłady dopasowanych danych

Oto kilka przykładów dopasowanych danych:

Przykład 1: Zduplikowane pomiary.

Załóżmy, że badacze chcą wiedzieć, czy waga jest w stanie ważyć pudła o każdej porze dnia w danym magazynie. Aby to sprawdzić, badacze używają wagi do ważenia 30 różnych pudełek rano, a następnie wieczorem.

Efektem końcowym są dwa zestawy danych, w których można „dopasować” do siebie poranna i wieczorna waga każdego pudełka.

Przykład sparowanych danych w przypadku podwójnych pomiarów

Przykład 2: pomiary przed i po.

Lekarz chce wiedzieć, czy nowy lek może obniżyć ciśnienie krwi pacjentów. Aby to sprawdzić, zmierzył ciśnienie krwi 20 różnych pacjentów przed i po tygodniowym stosowaniu leku.

Efektem końcowym są dwa zestawy danych, w których ciśnienie krwi przed i po każdej osobie można „dopasować” do siebie.

Przykład dopasowanych danych

Jak analizować sparowane dane

Istnieją dwa popularne sposoby analizowania sparowanych danych:

1. Wykonaj test t dla par.

Jednym ze sposobów analizy danych dla par jest wykonanie testu t dla par próbek , który porównuje średnie z dwóch próbek , gdy każdą obserwację z jednej próbki można dopasować do obserwacji z drugiej próbki.

Ten test mówi nam, czy średnia wartość jest równa między dwoma zbiorami danych.

2. Oblicz korelację pomiędzy dwoma zbiorami danych.

Innym sposobem analizy sparowanych danych jest obliczenie korelacji między dwoma zestawami danych.

Daje nam to wyobrażenie o kierunku i sile związku między wartościami dwóch zbiorów danych.

Sparowane dane i niedopasowane dane

W przeciwieństwie do danych sparowanych, dane niesparowane występują, gdy obserwacji z jednego zbioru danych nie można jednoznacznie powiązać z obserwacją z innego zbioru danych.

Załóżmy na przykład, że badacze chcą wiedzieć, czy określony program treningowy zwiększa średni skok pionowy koszykarzy.

Jednym ze sposobów sprawdzenia tego przy użyciu dopasowanych danych byłoby zmierzenie maksymalnego skoku pionowego tych samych 20 zawodników przed i po użyciu programu treningowego:

Sparowane lub niedopasowane dane

Aby to sprawdzić, korzystając z niesparowanych danych , badacze byli w stanie zmierzyć maksymalny skok pionowy u 20 zawodników, którzy nie korzystali z programu treningowego, a następnie zmierzyć maksymalny skok pionowy u 20 różnych zawodników, którzy korzystali z programu treningowego. 'szkolenie:

Przykład niesparowanych danych

Pracując ze sparowanymi danymi, używamy testu t dla par próbek , aby określić, czy różnica między średnimi z próby jest inna.

Kiedy pracujemy z danymi niesparowanymi, używamy testu t niezależnych próbek, aby określić, czy różnica między średnimi z próbki jest inna.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *