Wykres słupkowy to rodzaj wykresu, który wyświetla wartości liczbowe różnych zmiennych kategorycznych. W tym samouczku wyjaśniono, jak tworzyć mapy cieplne przy użyciu biblioteki wizualizacji Python Seaborn z wbudowanym zestawem danych wskazówek : import seaborn as sns #load tips dataset data =...
Najłatwiejszym sposobem uzyskania listy unikalnych wartości w kolumnie Pandas DataFrame jest użycie funkcji Unique() . W tym samouczku przedstawiono kilka przykładów użycia tej funkcji z następującą ramką DataFrame pand: import pandas as pd #createDataFrame df = pd. DataFrame ({' team ':...
Możesz użyć następującej składni, aby usunąć wiersze zawierające określony ciąg w ramce DataFrame pandy: df[df[" col "]. str . contains (" this string ") == False ] W tym samouczku wyjaśniono kilka przykładów praktycznego użycia tej składni w następującej ramce DataFrame:...
Możesz użyć następującej składni, aby zsumować wartości kolumny w pandzie DataFrame na podstawie warunku: df. loc [df[' col1 '] == some_value , ' col2 ']. sum () W tym samouczku przedstawiono kilka przykładów praktycznego zastosowania tej składni przy użyciu następującej ramki...
Centralne twierdzenie graniczne stwierdza, że rozkład próbkowania średniej próbki jest w przybliżeniu normalny, jeśli wielkość próby jest wystarczająco duża, nawet jeśli rozkład populacji nie jest normalny . Aby zastosować centralne twierdzenie graniczne, muszą być spełnione cztery warunki: 1. Randomizacja : Dane...
Histogram to wykres, który pomaga nam zwizualizować rozkład wartości w zestawie danych. Oś x histogramu przedstawia grupy wartości danych, a oś y informuje nas, ile obserwacji w zbiorze danych znajduje się w każdej grupie. Chociaż histogramy są przydatne do wizualizacji rozkładów,...
Test niezależności chi-kwadrat służy do określenia, czy istnieje istotny związek między dwiema zmiennymi kategorycznymi. W teście tym wykorzystuje się następujące hipotezy zerowe i alternatywne: H 0 : (hipoteza zerowa) Te dwie zmienne są niezależne. H 1 : (hipoteza alternatywna) Te dwie...
Błąd weryfikacyjny ma miejsce, gdy dane z badania są zbierane w taki sposób, że niektórzy członkowie populacji mają większe szanse na włączenie do próby niż inni. Może to skutkować otrzymaniem próbek, które nie są reprezentatywne dla populacji docelowej , co utrudnia...
Test Chow to test statystyczny opracowany przez ekonomistę Gregory’ego Chowa , który służy do sprawdzania, czy współczynniki dwóch różnych modeli regresji na różnych zbiorach danych są równe. Test Chow jest zwykle stosowany w ekonometrii z danymi szeregów czasowych w celu ustalenia,...
Test Chowa służy do sprawdzania, czy współczynniki dwóch różnych modeli regresji na różnych zbiorach danych są równe. Test ten jest zwykle stosowany w dziedzinie ekonometrii z danymi szeregów czasowych w celu ustalenia, czy w danym momencie występuje strukturalna przerwa w danych....