Często możesz chcieć pogrupować i zagregować wiele kolumn ramki danych pand. Na szczęście można to łatwo zrobić, korzystając z funkcji pandy .groupby() i .agg() . W tym samouczku wyjaśniono kilka przykładów praktycznego wykorzystania tych funkcji. Przykład 1: Pogrupuj według dwóch kolumn...
Często możesz chcieć znormalizować wartości danych jednej lub więcej kolumn w pandzie DataFrame. W tym samouczku wyjaśniono dwa sposoby, aby to zrobić: 1. Normalizacja Min-Max Cel: Konwertuje każdą wartość danych na wartość z zakresu od 0 do 1. Wzór: Nowa wartość...
Test Shapiro-Wilka jest testem normalności. Służy do określenia, czy próbka pochodzi z rozkładu normalnego . Aby wykonać test Shapiro-Wilka w Pythonie, możemy użyć funkcji scipy.stats.shapiro() , która wykorzystuje następującą składnię: scipy.stats.shapiro(x) Złoto: x: tabela przykładowych danych. Ta funkcja zwraca statystykę testową...
Test Kołmogorowa-Smirnowa służy do sprawdzenia, czy próbka pochodzi z określonego rozkładu. Aby wykonać test Kołmogorowa-Smirnowa w Pythonie, możemy użyć scipy.stats.kstest() w przypadku testu z jedną próbą lub scipy.stats.ks_2samp() w przypadku testu z dwiema próbami. W tym samouczku przedstawiono przykład wykorzystania każdej...
Naukowcy często pobierają próbki z populacji i wykorzystują dane z próbki do wyciągania wniosków na temat populacji jako całości. Powszechnie stosowaną metodą doboru próby jest dobór losowy warstwowy , w którym populację dzieli się na grupy, a z każdej grupy wybiera...
Często możesz chcieć zacieniować kolor punktów na wykresie rozrzutu Matplotlib w oparciu o trzecią zmienną. Na szczęście można to łatwo zrobić za pomocą funkcji matplotlib.pyplot.scatter() , która ma następującą składnię: matplotlib.pyplot.scatter(x, y, s=Brak, c=Brak, cmap=Brak) Złoto: x: Tabela wartości do wykorzystania...
Średni błąd kwadratowy (RMSE) to metryka, która mówi nam, jak średnio nasze przewidywane wartości różnią się od wartości obserwowanych w modelu. Oblicza się go w następujący sposób: RMSE = √[ Σ(P ja – O ja ) 2 / n ] Złoto:...
Często możesz chcieć zmienić rozmiar czcionki różnych elementów na wykresie Matplotlib. Na szczęście można to łatwo zrobić, korzystając z następującego kodu: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10) #fontsize of the title...
Wykres konturowy to rodzaj wykresu, który umożliwia wizualizację danych trójwymiarowych w dwóch wymiarach za pomocą konturów. Możesz utworzyć wykres konturowy w Matplotlib za pomocą następujących dwóch funkcji: matplotlib.pyplot.contour() – Tworzy wykresy konturowe. matplotlib.pyplot.contourf() – Tworzy wypełnione wykresy konturowe. Poniższe przykłady pokazują,...
Często możesz chcieć usunąć znaczniki z jednej lub więcej osi na wykresie Matplotlib. Na szczęście można to łatwo zrobić za pomocą funkcji tick_params() . W tym samouczku przedstawiono kilka przykładów wykorzystania tej funkcji w praktyce w oparciu o następujący wykres rozrzutu:...