In der Statistik wollen wir oft Daten sammeln, um bestimmte Forschungsfragen beantworten zu können. Beispielsweise möchten wir möglicherweise die folgenden Fragen beantworten: 1. Wie hoch ist das mittlere Haushaltseinkommen in Cincinnati, Ohio? 2. Wie hoch ist das durchschnittliche Gewicht einer bestimmten...
Die lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen verstehen können. Wenn wir eine lineare Regression durchführen, möchten wir normalerweise den Durchschnittswert der Antwortvariablen schätzen. Wir könnten jedoch stattdessen eine Methode...
Die lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen verstehen können. Wenn wir eine lineare Regression durchführen, möchten wir normalerweise den Durchschnittswert der Antwortvariablen schätzen. Wir könnten jedoch stattdessen eine Methode...
Ein gleitender Durchschnitt ist einfach der Durchschnitt einer Reihe vorheriger Perioden in einer Zeitreihe. Um den gleitenden Durchschnitt einer oder mehrerer Spalten in einem Pandas-DataFrame zu berechnen, können wir die folgende Syntax verwenden: df[' column_name ']. rolling ( rolling_window ). mean...
Mit der folgenden Syntax können Sie mehrere Zeilen in einem einzelnen Matplotlib-Diagramm anzeigen: import matplotlib. pyplot as plt plt. plot (df[' column1 ']) plt. plot (df[' column2 ']) plt. plot (df[' column3 ']) ... plt. show () Dieses Tutorial bietet mehrere...
Zwei Ereignisse schließen sich gegenseitig aus, wenn sie nicht gleichzeitig auftreten können. Angenommen, Ereignis A ist das Ereignis, bei dem ein Würfel auf einer geraden Zahl landet, und Ereignis B ist das Ereignis, bei dem ein Würfel auf einer ungeraden Zahl...
Eine dichotome Variable ist ein Variablentyp, der nur zwei mögliche Werte annimmt. Hier sind einige Beispiele für dichotome Variablen: Geschlecht: männlich oder weiblich Münzwurf: Kopf oder Zahl Immobilienart: Wohn- oder Gewerbeimmobilie Athletenstatus: Profi oder Amateur Prüfungsergebnisse: bestanden oder nicht bestanden Derartige...
Es gibt zwei Möglichkeiten, eine Punktwolke mithilfe von Daten aus einem Pandas-DataFrame zu erstellen: 1. Verwenden Sie pandas.DataFrame.plot.scatter Eine Möglichkeit, ein Streudiagramm zu erstellen, besteht darin, die in Pandas integrierte Funktion plot.scatter() zu verwenden: import pandas as pd df. plot ....
Ein Experiment ist eine kontrollierte wissenschaftliche Studie. In der Statistik führen wir häufig Experimente durch, um zu verstehen, wie sich die Änderung einer Variablen auf eine andere Variable auswirkt. Eine manipulierte Variable ist eine Variable, die wir ändern oder „manipulieren“, um...
Eine der wichtigsten Annahmen der linearen Regression besteht darin, dass die Residuen auf jeder Ebene der Prädiktorvariablen mit gleicher Varianz verteilt sind. Diese Annahme wird als Homoskedastizität bezeichnet. Wenn diese Annahme nicht berücksichtigt wird, spricht man von Heteroskedastizität in den Residuen....