Pandy: jak przedstawić wartość_liczby jako procent
Za pomocą funkcji value_counts() w pandach możesz zliczać wystąpienia wartości w danej kolumnie DataFrame.
Aby przedstawić wartości jako procenty, możesz użyć jednej z następujących metod:
Metoda 1: Przedstaw wartości jako procenty (w formacie dziesiętnym)
df. my_col . value_counts (normalize= True )
Metoda 2: Przedstaw wartości jako procenty (sformatowane za pomocą symboli procentów)
df. my_col . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '
Metoda 3: Przedstaw wartości w procentach (z licznikami)
counts = df. my_col . value_counts () percs = df. my_col . value_counts (normalize= True ) p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])
Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'], ' points ': [15, 12, 18, 20, 22, 28, 35, 40]}) #view DataFrame print (df) team points 0 to 15 1 to 12 2 B 18 3 B 20 4 B 22 5 B 28 6 B 35 7 C 40
Przykład 1: Przedstaw wartości jako procenty (w formacie dziesiętnym)
Poniższy kod pokazuje, jak policzyć wystąpienie każdej wartości w kolumnie zespołu i przedstawić wystąpienia jako procent całości, w formacie dziesiętnym:
#count occurrence of each value in 'team' column as percentage of total df. team . value_counts (normalize= True ) B 0.625 At 0.250 C 0.125 Name: team, dtype: float64
Z wyniku możemy zobaczyć:
- Wartość B reprezentuje 62,5% wystąpień w kolumnie zespół.
- Wartość A reprezentuje 25% wystąpień w kolumnie zespołu.
- Wartość C reprezentuje 12,5% wystąpień w kolumnie zespołu.
Należy pamiętać, że wartości procentowe są formatowane jako ułamki dziesiętne.
Przykład 2: Przedstaw wartości jako procenty (sformatowane za pomocą symboli procentów)
Poniższy kod pokazuje, jak policzyć wystąpienie każdej wartości w kolumnie zespołu i przedstawić wystąpienia jako procent całości, sformatowany za pomocą symboli procentu:
#count occurrence of each value in 'team' column as percentage of total df. team . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % ' B 62.5% At 25.0% C 12.5% Name: team, dtype: object
Należy pamiętać, że wartości procentowe są formatowane jako ciągi znaków z symbolami procentów.
Przykład 3: Przedstawianie liczb wartości jako procentów (za pomocą liczb)
Poniższy kod pokazuje, jak policzyć wystąpienie każdej wartości w kolumnie zespołu i przedstawić wystąpienia jako liczby i wartości procentowe:
#count occurrence of each value in 'team' column counts = df. team . value_counts () #count occurrence of each value in 'team' column as percentage of total percs = df. team . value_counts (normalize= True ) #concatenate results into one DataFrame p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage ']) count percentage B 5 0.625 At 2 0.250 C 1 0.125
Należy pamiętać, że kolumna liczby wyświetla liczbę każdej unikalnej wartości w kolumnie zespołu, podczas gdy kolumna procentowa wyświetla każdą unikalną wartość jako procent całkowitej liczby wystąpień.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: jak sporządzać rachunki wartości
Pandy: Jak korzystać z GroupBy i liczenia wartości
Pandy: jak wykreślać histogramy według grup