Jak wykreślić rozkład wartości kolumn w pandach


Możesz użyć następujących metod, aby wykreślić rozkład wartości kolumn w pandzie DataFrame:

Metoda 1: Wykreśl rozkład wartości w kolumnie

 df[' my_column ']. plot (kind=' kde ')

Metoda 2: Wykreśl rozkład wartości w jednej kolumnie, pogrupowanych według innej kolumny

 df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                            'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 
                              8, 7, 8, 9, 12, 12, 12, 14, 15, 17]})

#view DataFrame
print (df)

   team points
0 to 3
1 to 3
2 to 4
3 to 5
4 to 4
5 TO 7
6 to 7
7 to 7
8 to 10
9 to 11
10 B 8
11 B 7
12 B 8
13 B 9
14 B 12
15 B 12
16 B 12
17 B 14
18 B 15
19 B 17

Przykład 1: Wykreśl rozkład wartości w kolumnie

Poniższy kod pokazuje jak wykreślić rozkład wartości w kolumnie punktów :

 #plot distribution of values in points column
df[' points ']. plot (kind=' kde ')

Zauważ, że kind=’kde’ mówi pandom, aby użyły szacowania gęstości jądra , co daje gładką krzywą podsumowującą rozkład wartości zmiennej.

Jeśli zamiast tego chcesz utworzyć histogram, możesz określić kind=’hist’ w następujący sposób:

 #plot distribution of values in points column using histogram
df[' points ']. plot (kind=' hist ', edgecolor=' black ') 

Metoda ta wykorzystuje słupki do przedstawienia częstotliwości wartości w kolumnie punktów , w przeciwieństwie do gładkiej linii, która podsumowuje kształt rozkładu.

Przykład 2: Wykreśl rozkład wartości w jednej kolumnie, pogrupowanych według innej kolumny

Poniższy kod pokazuje jak wykreślić rozkład wartości w kolumnie punktów , pogrupowanych według kolumny zespołu :

 import matplotlib.pyplot as plt

#plot distribution of points by team 
df. groupby (' team ')[' points ']. plot (kind=' kde ')

#add legend
plt. legend ([' A ',' B '], title=' Team ')

#add x-axis label
plt. xlabel (' Points ')

Niebieska linia pokazuje rozkład punktów zawodników drużyny A, natomiast pomarańczowa linia pokazuje rozkład punktów zawodników drużyny B.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak dodać tytuły do działek w Pandach
Jak dostosować rozmiar figury na wykresie pandy
Jak wykreślić wiele ramek danych Pand w wykresach podrzędnych
Jak tworzyć i dostosowywać legendy fabuły w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *