So berechnen sie perzentile in python: mit beispielen
Das n-te Perzentil eines Datensatzes ist der Wert, der die obersten n Prozent der Datenwerte abschneidet, wenn alle Werte vom kleinsten zum größten sortiert werden.
Beispielsweise ist das 90. Perzentil eines Datensatzes der Wert, der die unteren 90 % der Datenwerte von den oberen 10 % der Datenwerte trennt.
Mit der Funktion numpy.percentile() können wir Perzentile in Python schnell berechnen, die die folgende Syntax verwendet:
numpy.percentile(a, q)
Gold:
- a: Wertetabelle
- q: Zu berechnendes Perzentil oder eine Folge von Perzentilen, die zwischen 0 und 100 (einschließlich) liegen muss.
In diesem Tutorial wird erläutert, wie Sie diese Funktion zum Berechnen von Perzentilen in Python verwenden.
So finden Sie die Perzentile einer Tabelle
Der folgende Code zeigt, wie man in Python verschiedene Perzentile für ein bestimmtes Array findet:
import numpy as np #make this example reproducible n.p. random . seeds (0) #create array of 100 random integers distributed between 0 and 500 data = np. random . randint (0, 500, 100) #find the 37th percentile of the array n.p. percentile (data, 37) 173.26 #Find the quartiles (25th, 50th, and 75th percentiles) of the array n.p. percentile (data, [25, 50, 75]) array([116.5, 243.5, 371.5])
So finden Sie Perzentile einer DataFrame-Spalte
Der folgende Code zeigt, wie Sie den 95. Perzentilwert für eine einzelne Pandas-DataFrame-Spalte ermitteln:
import numpy as np
import pandas as pd
#createDataFrame
df = pd.DataFrame({'var1': [25, 12, 15, 14, 19, 23, 25, 29, 33, 35],
'var2': [5, 7, 7, 9, 12, 9, 9, 4, 14, 15],
'var3': [11, 8, 10, 6, 6, 5, 9, 12, 13, 16]})
#find 90th percentile of var1 column
n.p. percentile (df. var1 , 95)
34.1
So finden Sie Perzentile mehrerer DataFrame-Spalten
Der folgende Code zeigt, wie Sie den 95. Perzentilwert für mehrere Spalten in einem Pandas-DataFrame finden:
import numpy as np
import pandas as pd
#createDataFrame
df = pd.DataFrame({'var1': [25, 12, 15, 14, 19, 23, 25, 29, 33, 35],
'var2': [5, 7, 7, 9, 12, 9, 9, 4, 14, 15],
'var3': [11, 8, 10, 6, 6, 5, 9, 12, 13, 16]})
#find 95th percentile of each column
df. quantile (.95)
var1 34.10
var2 14.55
var3 14.65
#find 95th percentile of just columns var1 and var2
df[[' var1 ', ' var2 ']]. quantile (.95)
var1 34.10
var2 14.55
Beachten Sie, dass wir in den obigen Beispielen die Funktion pandas quantile() verwenden konnten, um Perzentile zu berechnen.
Verwandte Themen: So berechnen Sie Perzentile in R (mit Beispielen)