Eine vollständige anleitung zum mtcars-datensatz in r


Der mtcars- Datensatz ist ein integrierter Datensatz in R, der Messungen zu 11 verschiedenen Attributen für 32 verschiedene Autos enthält.

In diesem Tutorial wird erklärt, wie Sie den mtcars- Datensatz in R untersuchen, zusammenfassen und visualisieren.

Verwandt: Eine vollständige Anleitung zum Iris-Datensatz in R

Laden Sie den mtcars-Datensatz

Da der mtcars- Datensatz ein in R integrierter Datensatz ist, können wir ihn mit dem folgenden Befehl laden:

 data(mtcars)

Mit der Funktion head() können wir uns die ersten sechs Zeilen des Datensatzes ansehen:

 #view first six rows of mtcars dataset
head(mtcars)

                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

Fassen Sie den mtcars-Datensatz zusammen

Mit der Funktion summary() können wir jede Variable im Datensatz schnell zusammenfassen:

 #summarize mtcars dataset
summary(mtcars)

      mpg cyl disp hp       
 Min. :10.40 Min. :4,000 Min. : 71.1 Min. : 52.0  
 1st Q:15.43 1st Q:4,000 1st Q:120.8 1st Q:96.5  
 Median: 19.20 Median: 6.000 Median: 196.3 Median: 123.0  
 Mean:20.09 Mean:6.188 Mean:230.7 Mean:146.7  
 3rd Q:22.80 3rd Q:8,000 3rd Q:326.0 3rd Q:180.0  
 Max. :33.90 Max. :8,000 Max. :472.0 Max. :335.0  
      drat wt qsec vs        
 Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000  
 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000  
 Median: 3.695 Median: 3.325 Median: 17.71 Median: 0.0000  
 Mean:3.597 Mean:3.217 Mean:17.85 Mean:0.4375  
 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000  
 Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000  
       am gear carb      
 Min. :0.0000 Min. :3,000 Min. :1,000  
 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000  
 Median: 0.0000 Median: 4.000 Median: 2.000  
 Mean:0.4062 Mean:3.688 Mean:2.812  
 3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000  
 Max. :1.0000 Max. :5,000 Max. :8,000

Für jede der 11 Variablen können wir die folgenden Informationen sehen:

  • Min : Der Mindestwert.
  • 1. Qu : Der Wert des ersten Quartils (25. Perzentil).
  • Median : Der Medianwert.
  • Durchschnitt : Der Durchschnittswert.
  • 3. Qu : Der Wert des dritten Quartils (75. Perzentil).
  • Max : Der Maximalwert.

Mit der Funktion dim() können wir die Dimensionen des Datensatzes in Bezug auf die Anzahl der Zeilen und Spalten ermitteln:

 #display rows and columns
dim(mtcars)

[1] 32 11

Wir können sehen, dass der Datensatz 32 Zeilen und 11 Spalten hat.

Wir können auch die Funktion „names()“ verwenden, um die Spaltennamen des Datenrahmens anzuzeigen:

 #display column names
names(mtcars)

 [1] "mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear"
[11] “carb”     

Visualisieren Sie den mtcars-Datensatz

Wir können auch Diagramme erstellen, um die Werte des Datensatzes zu visualisieren.

Beispielsweise können wir mit der Funktion hist() ein Histogramm der Werte einer bestimmten Variablen erstellen:

 #create histogram of values for mpg
hist(mtcars$mpg,
     col=' steelblue ',
     main=' Histogram ',
     xlab=' mpg ',
     ylab=' Frequency ')

Wir könnten auch die Funktion boxplot() verwenden, um einen Boxplot zu erstellen, um die Verteilung der Werte für eine bestimmte Variable zu visualisieren:

 #create boxplot of values for mpg
boxplot(mtcars$mpg,
        main=' Distribution of mpg values ',
        ylab=' mpg ',
        col=' steelblue ',
        border=' black ') 

Wir können auch die Funktion plot() verwenden, um ein Streudiagramm einer beliebigen paarweisen Kombination von Variablen zu erstellen:

 #create scatterplot of mpg vs. wt
plot(mtcars$mpg, mtcars$wt,
     col=' steelblue ',
     main=' Scatterplot ',
     xlab=' mpg ',
     ylab=' wt ',
     pch= 19 ) 

Mithilfe dieser integrierten Funktionen in R können wir viel über den mtcars- Datensatz lernen.

Wenn Sie eine erweiterte statistische Analyse mit diesem Datensatz durchführen möchten, schauen Sie sich dieses Tutorial an, in dem erklärt wird, wie Sie lineare Regressionsmodelle und verallgemeinerte lineare Modelle mithilfe des mtcars- Datensatzes anpassen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

Der einfachste Weg, Übersichtstabellen in R zu erstellen
So berechnen Sie die Zusammenfassung von fünf Zahlen in R
So führen Sie eine einfache lineare Regression in R durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert