Co to są powiązane dane? (wyjaśnienie i przykłady)
Kiedy dwa zbiory danych mają tę samą długość i każdą obserwację z jednego zbioru danych można „sparować” z obserwacją z innego zbioru danych, nazywamy to sparowanymi danymi .
Aby dwa zbiory danych zostały powiązane, ważne jest, aby każda obserwacja z jednego zbioru danych mogła być powiązana tylko z jedną obserwacją z drugiego zbioru danych.
Przykłady dopasowanych danych
Oto kilka przykładów dopasowanych danych:
Przykład 1: Zduplikowane pomiary.
Załóżmy, że badacze chcą wiedzieć, czy waga jest w stanie ważyć pudła o każdej porze dnia w danym magazynie. Aby to sprawdzić, badacze używają wagi do ważenia 30 różnych pudełek rano, a następnie wieczorem.
Efektem końcowym są dwa zestawy danych, w których można „dopasować” do siebie poranna i wieczorna waga każdego pudełka.
Przykład 2: pomiary przed i po.
Lekarz chce wiedzieć, czy nowy lek może obniżyć ciśnienie krwi pacjentów. Aby to sprawdzić, zmierzył ciśnienie krwi 20 różnych pacjentów przed i po tygodniowym stosowaniu leku.
Efektem końcowym są dwa zestawy danych, w których ciśnienie krwi przed i po każdej osobie można „dopasować” do siebie.
Jak analizować sparowane dane
Istnieją dwa popularne sposoby analizowania sparowanych danych:
1. Wykonaj test t dla par.
Jednym ze sposobów analizy danych dla par jest wykonanie testu t dla par próbek , który porównuje średnie z dwóch próbek , gdy każdą obserwację z jednej próbki można dopasować do obserwacji z drugiej próbki.
Ten test mówi nam, czy średnia wartość jest równa między dwoma zbiorami danych.
2. Oblicz korelację pomiędzy dwoma zbiorami danych.
Innym sposobem analizy sparowanych danych jest obliczenie korelacji między dwoma zestawami danych.
Daje nam to wyobrażenie o kierunku i sile związku między wartościami dwóch zbiorów danych.
Sparowane dane i niedopasowane dane
W przeciwieństwie do danych sparowanych, dane niesparowane występują, gdy obserwacji z jednego zbioru danych nie można jednoznacznie powiązać z obserwacją z innego zbioru danych.
Załóżmy na przykład, że badacze chcą wiedzieć, czy określony program treningowy zwiększa średni skok pionowy koszykarzy.
Jednym ze sposobów sprawdzenia tego przy użyciu dopasowanych danych byłoby zmierzenie maksymalnego skoku pionowego tych samych 20 zawodników przed i po użyciu programu treningowego:
Aby to sprawdzić, korzystając z niesparowanych danych , badacze byli w stanie zmierzyć maksymalny skok pionowy u 20 zawodników, którzy nie korzystali z programu treningowego, a następnie zmierzyć maksymalny skok pionowy u 20 różnych zawodników, którzy korzystali z programu treningowego. 'szkolenie:
Pracując ze sparowanymi danymi, używamy testu t dla par próbek , aby określić, czy różnica między średnimi z próby jest inna.
Kiedy pracujemy z danymi niesparowanymi, używamy testu t niezależnych próbek, aby określić, czy różnica między średnimi z próbki jest inna.