Häufig möchten Sie möglicherweise Werte in einer oder mehreren Spalten eines Pandas-DataFrames ersetzen. Glücklicherweise ist dies mit der Funktion .replace() einfach zu bewerkstelligen. Dieses Tutorial bietet mehrere Beispiele für die praktische Verwendung dieser Funktion im folgenden DataFrame: import pandas as pd...
In der Statistik wollen wir oft testen, ob eine Hypothese zu einem Populationsparameter wahr ist oder nicht. Wir könnten beispielsweise annehmen, dass das Durchschnittsgewicht einer bestimmten Schildkrötenpopulation 300 Pfund beträgt. Um festzustellen, ob diese Hypothese wahr ist, werden wir eine Probe...
Häufig möchten Sie möglicherweise Zeilen in einem Pandas-DataFrame basierend auf ihrem Indexwert auswählen. Wenn Sie Zeilen basierend auf der Ganzzahlindizierung auswählen möchten, können Sie die Funktion .iloc verwenden. Wenn Sie Zeilen basierend auf der Label-Indizierung auswählen möchten, können Sie die Funktion...
Häufig möchten Sie möglicherweise den Maximalwert pro Gruppe in einem Pandas-DataFrame ermitteln. Glücklicherweise ist dies mit den Funktionen groupby() und max() mit der folgenden Syntax einfach zu bewerkstelligen: df. groupby (' column_name '). max () In diesem Tutorial werden mehrere Beispiele...
Ein Cross-Laged-Panel-Design ist eine Art Strukturgleichungsmodell, das zwei verschiedene Variablen zu zwei Zeitpunkten misst. Angenommen, wir messen den Gesamtbetrag der Bildungsausgaben und das mittlere Haushaltseinkommen in einem bestimmten Land zu zwei verschiedenen Zeitpunkten. Wir könnten das folgende Diagramm verwenden, um dieses...
Wenn zwei Datensätze gleich lang sind und jede Beobachtung aus einem Datensatz mit einer Beobachtung aus einem anderen Datensatz „gepaart“ werden kann, nennen wir dies gepaarte Daten . Damit zwei Datensätze verknüpft werden können, ist es wichtig, dass jede Beobachtung aus...
Interpolation ist der Prozess der Schätzung eines unbekannten Werts einer Funktion zwischen zwei bekannten Werten. Bei zwei bekannten Werten (x 1 , y 1 ) und (x 2 , y 2 ) können wir den y-Wert für einen Punkt x mithilfe...
Es kommt häufig vor, dass in einer Reihe in Excel ein oder mehrere Werte fehlen, die Sie ergänzen möchten. Der einfachste Weg, fehlende Werte auszufüllen, besteht darin, die Funktion „Reihen füllen“ im Abschnitt „Bearbeiten“ der Registerkarte „Startseite“ zu verwenden. Dieses Tutorial...
Die relative Standardabweichung ist ein Maß für die Stichprobenstandardabweichung vom Stichprobenmittelwert für einen bestimmten Datensatz. Es wird wie folgt berechnet: Relative Standardabweichung = s/ x * 100 % Gold: s: Stichprobenstandardabweichung x : Stichprobenmittel Diese Metrik gibt uns eine Vorstellung davon,...
Der White-Test wird verwendet, um festzustellen, ob in einem Regressionsmodell Heteroskedastizität vorliegt. Unter Heteroskedastizität versteht man die ungleichmäßige Streuung der Residuen auf verschiedenen Ebenen einer Antwortvariablen in einem Regressionsmodell, was gegen eine der Schlüsselannahmen der linearen Regression verstößt, dass Residuen auf...