W statystyce skośność i kurtoza to dwa sposoby pomiaru kształtu rozkładu. Skośność jest miarą skośności rozkładu. Wartość ta może być dodatnia lub ujemna. Ujemna skośność wskazuje, że ogon znajduje się po lewej stronie rozkładu, który rozciąga się w stronę bardziej ujemnych...
Kwartyle to wartości dzielące zbiór danych na cztery równe części. Pierwszy kwartyl reprezentuje 25. percentyl zbioru danych. Drugi kwartyl reprezentuje 50. percentyl zbioru danych. Wartość ta jest równa medianie wartości zbioru danych. Trzeci kwartyl reprezentuje 75. percentyl zbioru danych. Możemy łatwo...
Dziedzina uczenia maszynowego zawiera ogromny zestaw algorytmów, które można wykorzystać do zrozumienia danych. Algorytmy te można podzielić na jedną z dwóch kategorii: 1. Algorytmy uczenia się nadzorowanego: obejmują budowanie modelu w celu oszacowania lub przewidzenia wyniku na podstawie jednego lub większej...
Możesz szybko wygenerować rozkład normalny w Pythonie za pomocą funkcji numpy.random.normal() , która wykorzystuje następującą składnię: numpy. random . normal (loc=0.0, scale=1.0, size=None) Złoto: loc: Średnia dystrybucji. Wartość domyślna to 0. skala: Odchylenie standardowe rozkładu. Wartość domyślna to 1. rozmiar: wielkość...
Algorytmy uczenia maszynowego można podzielić na dwa różne typy: algorytmy uczenia się nadzorowanego i nienadzorowanego . Algorytmy uczenia się nadzorowanego można podzielić na dwa typy: 1. Regresja: zmienna odpowiedzi ma charakter ciągły. Na przykład zmienną odpowiedzi może być: Waga Wysokość Cena...
Aby ocenić wydajność modelu na zbiorze danych, musimy zmierzyć, jak dobrze przewidywania modelu odpowiadają obserwowanym danym. W przypadku modeli regresji najczęściej stosowaną metryką jest błąd średniokwadratowy (MSE), który oblicza się w następujący sposób: MSE = (1/n)*Σ(y i – f(x i ))...
Prosta regresja liniowa to technika, której możemy użyć do zrozumienia związku pomiędzy pojedynczą zmienną objaśniającą a pojedynczą zmienną odpowiedzi . W skrócie, technika ta znajduje linię, która najlepiej „pasuje” do danych i przyjmuje następującą formę: ŷ = b 0 + b...
Prosta regresja liniowa to technika, której możemy użyć do zrozumienia związku pomiędzy pojedynczą zmienną objaśniającą a pojedynczą zmienną odpowiedzi . Technika ta znajduje linię, która najlepiej „pasuje” do danych i przyjmuje następującą postać: ŷ = b 0 + b 1 x...
Kiedy chcemy zrozumieć związek pomiędzy pojedynczą zmienną predykcyjną a zmienną odpowiedzi, często używamy prostej regresji liniowej . Jeśli jednak chcemy zrozumieć związek między wieloma zmiennymi predykcyjnymi a zmienną odpowiedzi, możemy zastosować wielokrotną regresję liniową . Jeśli mamy p zmiennych predykcyjnych, wówczas...
Kiedy chcemy zrozumieć związek między jedną lub większą liczbą zmiennych predykcyjnych a zmienną odpowiedzi ciągłej, często używamy regresji liniowej . Jeśli jednak zmienna odpowiedzi ma charakter kategoryczny, możemy zastosować regresję logistyczną . Regresja logistyczna jest rodzajem algorytmu klasyfikacji , ponieważ próbuje...