Pandy: jak przedstawić wartość_liczby jako procent


Za pomocą funkcji value_counts() w pandach możesz zliczać wystąpienia wartości w danej kolumnie DataFrame.

Aby przedstawić wartości jako procenty, możesz użyć jednej z następujących metod:

Metoda 1: Przedstaw wartości jako procenty (w formacie dziesiętnym)

 df. my_col . value_counts (normalize= True )

Metoda 2: Przedstaw wartości jako procenty (sformatowane za pomocą symboli procentów)

 df. my_col . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '

Metoda 3: Przedstaw wartości w procentach (z licznikami)

 counts = df. my_col . value_counts ()
percs = df. my_col . value_counts (normalize= True )
p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'],
                   ' points ': [15, 12, 18, 20, 22, 28, 35, 40]})

#view DataFrame
print (df)

  team points
0 to 15
1 to 12
2 B 18
3 B 20
4 B 22
5 B 28
6 B 35
7 C 40

Przykład 1: Przedstaw wartości jako procenty (w formacie dziesiętnym)

Poniższy kod pokazuje, jak policzyć wystąpienie każdej wartości w kolumnie zespołu i przedstawić wystąpienia jako procent całości, w formacie dziesiętnym:

 #count occurrence of each value in 'team' column as percentage of total
df. team . value_counts (normalize= True )

B 0.625
At 0.250
C 0.125
Name: team, dtype: float64

Z wyniku możemy zobaczyć:

  • Wartość B reprezentuje 62,5% wystąpień w kolumnie zespół.
  • Wartość A reprezentuje 25% wystąpień w kolumnie zespołu.
  • Wartość C reprezentuje 12,5% wystąpień w kolumnie zespołu.

Należy pamiętać, że wartości procentowe są formatowane jako ułamki dziesiętne.

Przykład 2: Przedstaw wartości jako procenty (sformatowane za pomocą symboli procentów)

Poniższy kod pokazuje, jak policzyć wystąpienie każdej wartości w kolumnie zespołu i przedstawić wystąpienia jako procent całości, sformatowany za pomocą symboli procentu:

 #count occurrence of each value in 'team' column as percentage of total
df. team . value_counts (normalize= True ). mul ( 100 ). round ( 1 ). astype (str) + ' % '

B 62.5%
At 25.0%
C 12.5%
Name: team, dtype: object

Należy pamiętać, że wartości procentowe są formatowane jako ciągi znaków z symbolami procentów.

Przykład 3: Przedstawianie liczb wartości jako procentów (za pomocą liczb)

Poniższy kod pokazuje, jak policzyć wystąpienie każdej wartości w kolumnie zespołu i przedstawić wystąpienia jako liczby i wartości procentowe:

 #count occurrence of each value in 'team' column
counts = df. team . value_counts ()

#count occurrence of each value in 'team' column as percentage of total
percs = df. team . value_counts (normalize= True )

#concatenate results into one DataFrame
p.d. concat ([counts, percs], axis= 1 , keys=[' count ', ' percentage '])

        count percentage
B 5 0.625
At 2 0.250
C 1 0.125

Należy pamiętać, że kolumna liczby wyświetla liczbę każdej unikalnej wartości w kolumnie zespołu, podczas gdy kolumna procentowa wyświetla każdą unikalną wartość jako procent całkowitej liczby wystąpień.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: jak sporządzać rachunki wartości
Pandy: Jak korzystać z GroupBy i liczenia wartości
Pandy: jak wykreślać histogramy według grup

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *