Zbiór danych można zapisać w dwóch różnych formatach: szerokim i długim . Szeroki format zawiera wartości, które nie powtarzają się w pierwszej kolumnie. Długi format zawiera wartości, które powtarzają się w pierwszej kolumnie. Rozważmy na przykład następujące dwa zbiory danych, które...
W statystyce przypadki odnoszą się po prostu do osób w zbiorze danych. W większości zbiorów danych mamy przypadki (osobniki) i zmienne (atrybuty jednostek). Na przykład następujący zbiór danych zawiera 10 przypadków i 3 zmienne, które mierzymy dla każdego przypadku: Należy pamiętać,...
Możesz użyć argumentu cmap w Matplotlib, aby łatwo wyświetlać obrazy w skali szarości . Poniższy przykład pokazuje, jak zastosować ten argument w praktyce. Przykład: wyświetl obraz w skali szarości w Matplotlib Załóżmy, że mam następujący obraz o nazwie Shape.JPG , który...
Test Kołmogorowa-Smirnowa służy do określenia, czy próbka ma rozkład normalny , czy nie. Test ten jest szeroko stosowany, ponieważ wiele testów i procedur statystycznych zakłada , że dane mają rozkład normalny. Poniższy przykład pokazuje krok po kroku, jak wykonać test Kołmogorowa-Smirnowa...
Funkcja skala() w R może służyć do skalowania wartości w wektorze, macierzy lub ramce danych. Ta funkcja wykorzystuje następującą podstawową składnię: scale(x, center = TRUE , scale = TRUE ) Złoto: x : Nazwa obiektu do skalowania center : czy odjąć...
Błąd, który możesz napotkać w Pythonie to: TypeError :Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool] Ten błąd zwykle występuje, gdy próbujesz odfiltrować ramkę danych pandy przy użyciu wielu warunków, ale nie możesz użyć nawiasów wokół...
Centrowanie zbioru danych oznacza odjęcie średniej wartości każdej pojedynczej obserwacji w zbiorze danych. Po wyśrodkowaniu zestawu danych średnia wartość zestawu danych wynosi zero. Poniższe przykłady pokazują, jak wyśrodkować dane w Pythonie. Przykład 1: Wyśrodkuj wartości tablicy NumPy Załóżmy, że mamy następującą...
Do przewidywania wiarygodności testu po zmianie czasu trwania testu stosuje się wzór Spearmana-Browna . Formuła jest następująca: Przewidywana niezawodność = kr / (1 + (k-1)r) Złoto: k : Czynnik, według którego modyfikowany jest czas trwania testu. Na przykład, jeśli oryginalny test...
Funkcji split() w języku R można używać do dzielenia danych na grupy w oparciu o poziomy czynników. Ta funkcja wykorzystuje następującą podstawową składnię: podziel(x, f, …) Złoto: x : Nazwa wektora lub bloku danych do podziału na grupy f : Czynnik...
Test Walda można zastosować do sprawdzenia, czy jeden lub więcej parametrów modelu ma określone wartości. Test ten jest często używany do określenia, czy jedna lub więcej zmiennych predykcyjnych w modelu regresji jest równych zero. W tym teście używamy następujących hipotez zerowych...