Curve-aanpassing in google spreadsheets (met voorbeelden)
Vaak wilt u misschien de vergelijking vinden die het beste past bij een curve voor een reeks gegevens in Google Spreadsheets.
Gelukkig is dit vrij eenvoudig te doen met behulp van de Trendline- functie in Google Spreadsheets.
Deze tutorial biedt een stapsgewijs voorbeeld van hoe u een vergelijking aan een curve in Google Spreadsheets kunt aanpassen.
Stap 1: Creëer de gegevens
Laten we eerst een nep-dataset maken om mee te werken:
Stap 2: Maak een spreidingsdiagram
Laten we vervolgens een spreidingsdiagram maken om de gegevensset te visualiseren.
Markeer cellen A2:B16 en klik vervolgens op het tabblad Invoegen en vervolgens op Grafiek :
Standaard voegt Google Spreadsheets een lijndiagram in.
We kunnen dit echter gemakkelijk veranderen in een spreidingsdiagram.
In het paneel Diagrameditor dat aan de rechterkant van het scherm verschijnt, klikt u op de vervolgkeuzepijl naast Diagramtype en kiest u Spreidingsdiagram :
Het volgende spreidingsdiagram verschijnt:
Stap 3: Voeg een trendlijn toe
Klik in het paneel Grafiekeditor op het tabblad Aanpassen . Klik vervolgens op de vervolgkeuzelijst Serie . Vink vervolgens het vakje naast Trendline aan.
Vink vervolgens het vakje hieronder aan met Show R 2 .
De volgende lineaire trendlijn wordt automatisch aan de grafiek toegevoegd:
De R-kwadraat vertelt ons het percentage variatie in deresponsvariabele dat kan worden verklaard door de voorspellende variabelen.
De R-kwadraat voor deze specifieke curve is 0,363 .
Gerelateerd: Wat is een goede R-kwadraatwaarde?
Stap 4: Kies de beste trendlijn
Uit de bovenstaande grafiek blijkt duidelijk dat de lineaire trendlijn er niet in slaagt het gedrag van de gegevens vast te leggen.
In plaats daarvan kunnen we ervoor kiezen om een polynomiale curve te fitten.
Om dit te doen, klikt u op de vervolgkeuzepijl onder Type en kiest u Polynoom .
Klik vervolgens op de vervolgkeuzepijl onder Polynomiale graad en kies 4 .
Klik ten slotte op de vervolgkeuzepijl onder Label en klik op Vergelijking gebruiken :
Dit resulteert in de volgende curve:
De vergelijking van de curve is als volgt:
y = -0,0192x 4 + 0,7081x 3 – 8,3649x 2 + 35,823x – 26,516
De R-kwadraat voor deze specifieke curve is 0,971 .
Deze R-kwadraat is aanzienlijk hoger dan die van de vorige trendlijn, wat aangeeft dat deze veel beter aansluit bij de dataset.
We kunnen deze curvevergelijking ook gebruiken om de waarde van de responsvariabele te voorspellen op basis van de voorspellende variabele.
Als x = 4 bijvoorbeeld, voorspellen we dat y = 23,34 :
y = -0,0192(4) 4 + 0,7081(4) 3 – 8,3649(4) 2 + 35,823(4) – 26,516 = 23,34
Opmerking : Mogelijk moet u met de polynomiale graadwaarde spelen totdat u een curve vindt die goed bij de gegevens lijkt te passen zonder overfitting .
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in Google Spreadsheets kunt uitvoeren:
Lineaire regressie uitvoeren in Google Spreadsheets
Hoe u een best passende rij kunt vinden in Google Spreadsheets
Hoe u een prognose maakt in Google Spreadsheets