Co to są powiązane dane? (wyjaśnienie i przykłady)

Przez Benjamin Anderson 27 lipca, 2023 Przewodnik 0 komentarzy

Kiedy dwa zbiory danych mają tę samą długość i każdą obserwację z jednego zbioru danych można „sparować” z obserwacją z innego zbioru danych, nazywamy to sparowanymi danymi .

Sparowane dane

Aby dwa zbiory danych zostały powiązane, ważne jest, aby każda obserwacja z jednego zbioru danych mogła być powiązana tylko z jedną obserwacją z drugiego zbioru danych.

Przykłady dopasowanych danych

Oto kilka przykładów dopasowanych danych:

Przykład 1: Zduplikowane pomiary.

Załóżmy, że badacze chcą wiedzieć, czy waga jest w stanie ważyć pudła o każdej porze dnia w danym magazynie. Aby to sprawdzić, badacze używają wagi do ważenia 30 różnych pudełek rano, a następnie wieczorem.

Efektem końcowym są dwa zestawy danych, w których można „dopasować” do siebie poranna i wieczorna waga każdego pudełka.

Przykład sparowanych danych w przypadku podwójnych pomiarów

Przykład 2: pomiary przed i po.

Lekarz chce wiedzieć, czy nowy lek może obniżyć ciśnienie krwi pacjentów. Aby to sprawdzić, zmierzył ciśnienie krwi 20 różnych pacjentów przed i po tygodniowym stosowaniu leku.

Efektem końcowym są dwa zestawy danych, w których ciśnienie krwi przed i po każdej osobie można „dopasować” do siebie.

Przykład dopasowanych danych

Jak analizować sparowane dane

Istnieją dwa popularne sposoby analizowania sparowanych danych:

1. Wykonaj test t dla par.

Jednym ze sposobów analizy danych dla par jest wykonanie testu t dla par próbek , który porównuje średnie z dwóch próbek , gdy każdą obserwację z jednej próbki można dopasować do obserwacji z drugiej próbki.

Ten test mówi nam, czy średnia wartość jest równa między dwoma zbiorami danych.

2. Oblicz korelację pomiędzy dwoma zbiorami danych.

Innym sposobem analizy sparowanych danych jest obliczenie korelacji między dwoma zestawami danych.

Daje nam to wyobrażenie o kierunku i sile związku między wartościami dwóch zbiorów danych.

Sparowane dane i niedopasowane dane

W przeciwieństwie do danych sparowanych, dane niesparowane występują, gdy obserwacji z jednego zbioru danych nie można jednoznacznie powiązać z obserwacją z innego zbioru danych.

Załóżmy na przykład, że badacze chcą wiedzieć, czy określony program treningowy zwiększa średni skok pionowy koszykarzy.

Jednym ze sposobów sprawdzenia tego przy użyciu dopasowanych danych byłoby zmierzenie maksymalnego skoku pionowego tych samych 20 zawodników przed i po użyciu programu treningowego:

Sparowane lub niedopasowane dane

Aby to sprawdzić, korzystając z niesparowanych danych , badacze byli w stanie zmierzyć maksymalny skok pionowy u 20 zawodników, którzy nie korzystali z programu treningowego, a następnie zmierzyć maksymalny skok pionowy u 20 różnych zawodników, którzy korzystali z programu treningowego. 'szkolenie:

Przykład niesparowanych danych

Pracując ze sparowanymi danymi, używamy testu t dla par próbek , aby określić, czy różnica między średnimi z próby jest inna.

Kiedy pracujemy z danymi niesparowanymi, używamy testu t niezależnych próbek, aby określić, czy różnica między średnimi z próbki jest inna.

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej

Przykłady dopasowanych danych

Jak analizować sparowane dane

Sparowane dane i niedopasowane dane

o autorze

Dr Benjamin Anderson

Dodaj komentarz