Come creare una nuvola di punti da un pandas dataframe
Esistono due modi per creare una nuvola di punti utilizzando i dati di un DataFrame panda:
1. Utilizzare pandas.DataFrame.plot.scatter
Un modo per creare un grafico a dispersione è utilizzare la funzione plot.scatter() incorporata di Panda:
import pandas as pd df. plot . scatter (x = ' x_column_name ', y = ' y_columnn_name ')
2. Utilizzare matplotlib.pyplot.scatter
Un altro modo per creare un grafico a dispersione è utilizzare la funzione Matplotlib pyplot.scatter() :
import matplotlib. pyplot as plt plt. scatter (df.x, df.y)
Questo tutorial fornisce un esempio di utilizzo di ciascuno di questi metodi.
Esempio 1: usare i panda
Il codice seguente mostra come utilizzare la funzione plot.scatter() per creare un semplice grafico a dispersione:
import pandas as pd #createDataFrame df = pd. DataFrame ({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15], 'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]}) #create scatterplot df. plot . scatter (x=' x ', y=' y ')
Tieni presente che puoi utilizzare gli argomenti s e c per modificare rispettivamente la dimensione e il colore dei punti:
df. plot . scatter (x=' x ', y=' y ', s= 60 , c=' green ')
Esempio 2: utilizzo di Matplotlib
Il codice seguente mostra come utilizzare la funzione pyplot.scatter() per creare un grafico a dispersione:
import pandas as pd import matplotlib. pyplot as plt #createDataFrame df = pd. DataFrame ({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15], 'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]}) #create scatterplot plt. scatter (df.x, df.y)
Tieni presente che puoi utilizzare gli argomenti s e c per modificare rispettivamente la dimensione e il colore dei punti:
plt. scatter (df.x, df.y, s= 60 , c=' purple ')
Puoi trovare altri tutorial su Python qui .