Hoe u een parenplot maakt in python
Een paarplot is een spreidingsdiagrammatrix waarmee u de paarsgewijze relatie tussen verschillende variabelen in een gegevensset kunt begrijpen.
De eenvoudigste manier om een paarplot in Python te maken, is door de functieseaborn.pairplot(df) te gebruiken.
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Paarplot voor alle variabelen
De volgende code laat zien hoe u een paarsgewijze plot kunt maken voor elke numerieke variabele in de seaborn-dataset genaamd iris :
import pandas as pd import matplotlib. pyplot as plt import seaborn as sns #define dataset iris = sns. load_dataset (“ iris ”) #create pairs plot for all numeric variables sns. pairplot (iris)
De manier om de matrix te interpreteren is als volgt:
- De verdeling van elke variabele wordt weergegeven als een histogram langs de diagonale vakken.
- Alle andere vakken geven een spreidingsdiagram weer van de relatie tussen elke paarsgewijze combinatie van variabelen. Het vak in de linkerbenedenhoek van de matrix toont bijvoorbeeld een spreidingsdiagram van waarden voor petal_width versus sepal_length .
Deze enkele grafiek geeft ons een idee van de relatie tussen elk paar variabelen in onze dataset.
Voorbeeld 2: Paren plotten voor specifieke variabelen
We kunnen ook alleen bepaalde variabelen specificeren die in de paargrafiek moeten worden opgenomen:
sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])
Voorbeeld 3: Paren met kleur plotten per categorie
We kunnen ook een paarplot maken dat elk punt in elke plot kleurt op basis van een categorische variabele met behulp van het tintargument :
sns. pairplot (iris, hue=' species ')
Door het tintargument te gebruiken, kunnen we de gegevens beter begrijpen.
Aanvullende bronnen
Hoe u barplots maakt met Seaborn
Hoe u hittekaarten maakt met Seaborn
Een titel toevoegen aan Seaborn-plots