Przewodnik - Statorials

Jak wykonać test goldfelda-quandta w pythonie

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Test Goldfelda-Quandta służy do określenia, czy w modelu regresji występuje heteroskedastyczność . Heteroscedastyczność odnosi się do nierównego rozproszenia reszt na różnych poziomachzmiennej odpowiedzi w modelu regresji. Jeśli występuje heteroskedastyczność, narusza to jedno z kluczowych założeń regresji liniowej , że reszty są...

[Kontynuuj czytanie...]

Jak grupować według roku w pandas dataframe (z przykładem)

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Aby grupować wiersze według roku w ramce DataFrame pandy, możesz użyć następującej podstawowej składni: df. groupby (df. your_date_column . dt . year )[' values_column ']. sum () Ta konkretna formuła grupuje wiersze według daty w kolumnie twoja_data i oblicza sumę wartości...

[Kontynuuj czytanie...]

Jak przekonwertować wiersz ramki danych pandas na listę (z przykładem)

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Aby przekonwertować wiersz ramki DataFrame pandy na listę, możesz użyć następującej podstawowej składni: row_list = df. loc [2 ,:]. values . flatten (). tolist () Ta konkretna składnia konwertuje wartości znajdujące się na pozycji 2 indeksu wiersza DataFrame na listę. Poniższy...

[Kontynuuj czytanie...]

Jak wyodrębnić współczynniki regresji z modelu scikit-learn

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następującej podstawowej składni, aby wyodrębnić współczynniki regresji z modelu regresji zbudowanego za pomocą scikit-learn w Pythonie: p.d. DataFrame ( zip ( X.columns , model.coef_ )) Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce. Przykład: wyodrębnij współczynniki regresji z...

[Kontynuuj czytanie...]

Jak uzyskać ostatni wiersz w pandas dataframe (z przykładem)

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Aby uzyskać ostatni wiersz ramki DataFrame pandy, możesz użyć następujących metod: Metoda 1: Uzyskaj ostatni rząd (jako seria Pandy) last_row = df. iloc [-1] Metoda 2: Uzyskaj ostatni wiersz (jako ramka danych Pandas) last_row = df. iloc [-1:] Poniższe przykłady pokazują,...

[Kontynuuj czytanie...]

Jak wykonać ważoną regresję metodą najmniejszych kwadratów w pythonie

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Jednym z kluczowych założeń regresji liniowej jest to, że reszty mają rozkład z równą wariancją na każdym poziomie zmiennej predykcyjnej. Założenie to znane jest jako homoskedastyczność . Jeżeli to założenie nie jest przestrzegane, w resztach występuje heteroskedastyczność . Kiedy tak się...

[Kontynuuj czytanie...]

Jak naprawić w r: błąd: zduplikowane identyfikatory wierszy

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Błąd, który możesz napotkać w R to: Error: Duplicate identifiers for rows Ten błąd występuje, gdy próbujesz użyć funkcji spread() do rozłożenia wartości jednej lub większej liczby kolumn w ramce danych na ich własne kolumny. Jednak może wystąpić błąd, jeśli dla...

[Kontynuuj czytanie...]

Jak usunąć na z działki w ggplot2 (z przykładem)

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następującej podstawowej składni, aby usunąć wartości NA z wykresu w ggplot2: library (ggplot2) ggplot(data=subset(df, ! is. na (this_column)), aes(x=this_column)) + geom_bar() W tym konkretnym przykładzie tworzony jest wykres słupkowy i usuwane są wszystkie wiersze z ramki danych, w których...

[Kontynuuj czytanie...]

Jak utworzyć wykres w ggplot2 przy użyciu wielu ramek danych

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć następującej podstawowej składni, aby utworzyć wykres w ggplot2 przy użyciu wielu ramek danych: library (ggplot2) ggplot() + geom_line(data=df1, aes(x=x_var, y=y_var), color=' blue ') + geom_line(data=df2, aes(x=x_var, y=y_var), color=' red ') Ten konkretny przykład kreśli wiele linii na jednym wykresie...

[Kontynuuj czytanie...]

Dplyr: jak podsumować dane, ale zachować wszystkie kolumny

Przez Benjamin Anderson 15 lipca, 2023 Przewodnik 0 komentarzy

Podczas korzystania z funkcji podsumowania() w dplyr wszelkie zmienne nieuwzględnione w funkcjach podsumowania() lub group_by() zostaną automatycznie usunięte. Można jednak użyć funkcji mutate() w celu podsumowania danych, zachowując wszystkie kolumny w ramce danych. Poniższy przykład pokazuje, jak w praktyce wykorzystać tę...

[Kontynuuj czytanie...]

Kategoria: Przewodnik