Jak przekształcać dane w programie excel (log, pierwiastek kwadratowy, pierwiastek sześcienny)
Wiele testów statystycznych zakłada, że zbiory danych mają rozkład normalny .
Jednak w praktyce założenie to jest często łamane. Jednym ze sposobów rozwiązania tego problemu jest przekształcenie wartości w zbiorze danych za pomocą jednej z trzech następujących transformacji:
1. Log Transform: Przekształć y wartości w log(y) .
2. Transformacja pierwiastka kwadratowego: przekształć wartości y na √y .
3. Transformacja pierwiastka sześciennego: przekształć wartości y na y 1/3 .
Wykonując te przekształcenia, dane generalnie zbliżają się do rozkładu normalnego. Poniższe przykłady pokazują, jak wykonać te przekształcenia w programie Excel.
Zaloguj transformację w programie Excel
Aby zastosować transformację logiczną do zbioru danych w programie Excel, możemy użyć funkcji =LOG10() .
Poniższy zrzut ekranu pokazuje, jak zastosować transformację dziennika do zestawu danych w programie Excel:
Aby ustalić, czy ta transformacja spowodowała, że zbiór danych ma bardziej normalny rozkład, możemy wykonać test normalności Jarque’a-Bera w programie Excel .
Statystyka testowa dla tego testu jest zdefiniowana jako:
JB =(n/6) * ( S2 + ( C2 /4))
Złoto:
- n: liczba obserwacji w próbie
- S: asymetria próbki
- C: pochlebna próbka
Przy zerowej hipotezie normalności JB ~ X 2 (2).
Jeśli wartość p odpowiadająca statystyce testowej jest poniżej pewnego poziomu istotności (np. α = 0,05), wówczas możemy odrzucić hipotezę zerową i stwierdzić, że dane nie mają rozkładu normalnego.
Poniższy zrzut ekranu pokazuje, jak wykonać test Jarque-Bera dla danych surowych i danych przekształconych:
Należy zauważyć, że wartość p surowych danych jest mniejsza niż 0,05, co wskazuje, że nie ma ona rozkładu normalnego.
Jednakże wartość p przekształconych danych jest nie mniejsza niż 0,05, zatem możemy założyć, że ma ona rozkład normalny. To mówi nam, że transformacja logu zadziałała.
Transformacja pierwiastkowa w programie Excel
Aby zastosować transformację pierwiastkową do zbioru danych w Excelu, możemy użyć funkcji =SQRT() .
Poniższy zrzut ekranu pokazuje, jak zastosować transformację pierwiastkową do zbioru danych w programie Excel:
Należy zauważyć, że wartość p testu normalności Jarque-Bera dla przekształconych danych jest nie mniejsza niż 0,05, co wskazuje, że transformacja pierwiastkowa była skuteczna.
Transformacja pierwiastka sześciennego w programie Excel
Aby zastosować transformację pierwiastka sześciennego do zbioru danych w programie Excel, możemy użyć funkcji =DATA^(1/3) .
Poniższy zrzut ekranu pokazuje, jak zastosować transformację pierwiastka sześciennego do zestawu danych w programie Excel:
Wartość p testu normalności Jarque-Bera dla przekształconych danych jest nie mniejsza niż 0,05, co wskazuje, że transformacja pierwiastkowa była skuteczna.
Trzy transformacje danych skutecznie spowodowały, że surowe dane miały bardziej normalny rozkład.
Spośród trzech transformacji transformacja logarytmiczna dała najwyższą wartość p w teście normalności Jarque-Bera, co mówi nam, że prawdopodobnie sprawiło, że dane były „najbardziej” danymi o rozkładzie normalnym spośród trzech metod transformacji.
Dodatkowe zasoby
Jak wykonać transformację Boxa-Coxa w programie Excel
Jakie jest założenie normalności w statystyce?