Hoe u een parenplot maakt in python


Een paarplot is een spreidingsdiagrammatrix waarmee u de paarsgewijze relatie tussen verschillende variabelen in een gegevensset kunt begrijpen.

De eenvoudigste manier om een paarplot in Python te maken, is door de functieseaborn.pairplot(df) te gebruiken.

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Paarplot voor alle variabelen

De volgende code laat zien hoe u een paarsgewijze plot kunt maken voor elke numerieke variabele in de seaborn-dataset genaamd iris :

 import pandas as pd
import matplotlib. pyplot as plt
import seaborn as sns

#define dataset
iris = sns. load_dataset (“ iris ”)

#create pairs plot for all numeric variables
sns. pairplot (iris)

Paren plotten in Python

De manier om de matrix te interpreteren is als volgt:

  • De verdeling van elke variabele wordt weergegeven als een histogram langs de diagonale vakken.
  • Alle andere vakken geven een spreidingsdiagram weer van de relatie tussen elke paarsgewijze combinatie van variabelen. Het vak in de linkerbenedenhoek van de matrix toont bijvoorbeeld een spreidingsdiagram van waarden voor petal_width versus sepal_length .

Deze enkele grafiek geeft ons een idee van de relatie tussen elk paar variabelen in onze dataset.

Voorbeeld 2: Paren plotten voor specifieke variabelen

We kunnen ook alleen bepaalde variabelen specificeren die in de paargrafiek moeten worden opgenomen:

 sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])

Voorbeeld 3: Paren met kleur plotten per categorie

We kunnen ook een paarplot maken dat elk punt in elke plot kleurt op basis van een categorische variabele met behulp van het tintargument :

 sns. pairplot (iris, hue=' species ') 

Paren plotten in Python met kleur per categorie

Door het tintargument te gebruiken, kunnen we de gegevens beter begrijpen.

Aanvullende bronnen

Hoe u barplots maakt met Seaborn
Hoe u hittekaarten maakt met Seaborn
Een titel toevoegen aan Seaborn-plots

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert