Hoe u een restplot maakt in google spreadsheets


Een residuele plot is een type plot dat de gepaste waarden weergeeft tegen de residuen voor een regressiemodel.

Dit type plot wordt vaak gebruikt om te evalueren of een lineair regressiemodel al dan niet geschikt is voor een bepaalde dataset en om residuen te controleren op heteroskedasticiteit .

Het volgende stapsgewijze voorbeeld laat zien hoe u een residuele plot kunt maken voor een eenvoudig lineair regressiemodel in Google Spreadsheets.

Stap 1: Voer de gegevens in

Laten we beginnen met het invoeren van de volgende waarden voor een dataset:

Stap 2: Bereken de regressiemodelvergelijking

Vervolgens zullen we de functies SLOPE en INTERCEPT gebruiken om de eenvoudige lineaire regressiemodelvergelijking voor deze dataset te berekenen:

Met behulp van deze waarden kunnen we de volgende eenvoudige lineaire regressievergelijking schrijven:

y = 29,631 + 0,755x

Stap 3: Bereken voorspelde waarden

Vervolgens kunnen we de regressievergelijking gebruiken om de voorspelde waarden voor elke waarneming te berekenen.

We typen de volgende formule in cel C2 :

 = $B$16 + $B$15 * A2

We kunnen deze formule vervolgens kopiëren en plakken in elke resterende cel in kolom C :

Stap 4: Bereken de residuen

Een residu is het verschil tussen een waargenomen waarde en een voorspelde waarde in een regressiemodel.

Het wordt als volgt berekend:

Residueel = Waargenomen waarde – Voorspelde waarde

Om het residu voor elke waarneming in onze dataset te berekenen, kunnen we de volgende formule in cel D2 typen:

 = B2 - C2

We kunnen deze formule vervolgens kopiëren en in elke resterende cel in kolom D plakken:

Stap 5: Maak het restplot

Om de restplot te maken, kunnen we de waarden in het bereik A2:A13 markeren, vervolgens de „Ctrl“-toets ingedrukt houden en de waarden in het bereik D2:D13 markeren.

Klik vervolgens op het tabblad Invoegen en klik vervolgens op Grafiek in het vervolgkeuzemenu.

In het paneel Grafiekeditor dat aan de rechterkant van het scherm verschijnt, kiest u Spreidingsdiagram als diagramtype:

Het volgende restplot verschijnt automatisch:

restplot Google Spreadsheets

Op de x-as worden de waarden van de voorspellende variabele in ons regressiemodel weergegeven en op de y-as de residuen.

Een belangrijke aanname van lineaire regressie is dat de residuen een constante variantie hebben op elk niveau van x. Daarom gebruiken we vaak een grafiek van de residuen om te bepalen of aan deze veronderstelling wordt voldaan.

Als de residuen ongeveer gelijkmatig rond nul in de grafiek zijn verdeeld en er geen duidelijke trend is, zeggen we doorgaans dat aan de aanname van constante variantie is voldaan.

In onze residuengrafiek hierboven kunnen we zien dat de punten in de grafiek willekeurig rond nul verspreid lijken te zijn, zonder duidelijk patroon. We zouden daarom concluderen dat voor dit specifieke regressiemodel aan de aanname van constante variantie is voldaan.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Google Spreadsheets kunt uitvoeren:

Lineaire regressie uitvoeren in Google Spreadsheets
Hoe polynomiale regressie uit te voeren in Google Spreadsheets

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert