Hoe een cdf in python te berekenen en uit te zetten
U kunt de volgende basissyntaxis gebruiken om de cumulatieve distributiefunctie (CDF) in Python te berekenen:
#sortdata x = np. sort (data) #calculate CDF values y = 1. * np. range (len(data)) / (len(data) - 1) #plot CDF plt. plot (x, y)
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: CDF met willekeurige distributie
De volgende code laat zien hoe u een cumulatieve distributiefunctie (CDF) voor een willekeurige steekproef van gegevens in Python kunt berekenen en plotten:
import numpy as np import matplotlib. pyplot as plt #define random sample of data data = np. random . rann (10000) #sortdata x = np. sort (data) #calculate CDF values y = 1. * np. range (len(data)) / (len(data) - 1) #plot CDF plt. plot (x, y) plt. xlabel (' x ')
Op de x-as worden de ruwe gegevenswaarden weergegeven en op de y-as de bijbehorende CDF-waarden.
Voorbeeld 2: CDF met normale verdeling
Als u de cumulatieve verdelingsfunctie van een bekende verdeling (zoals de normale verdeling ) wilt plotten, kunt u de volgende functies uit de SciPy- bibliotheek gebruiken:
import numpy as np
import scipy
import matplotlib. pyplot as plt
#generate data from normal distribution
data = np. random . rann (1000)
#sortdata
x = np. sort (data)
#calculate CDF values
y = scipy. stats . norm . cdf (x)
#plot CDF
plt. plot (data_sorted, norm_cdf)
#plot CDF
plt. plot (x, y)
plt. xlabel (' x ')
Aanvullende bronnen
CDF of PDF: wat is het verschil?
Hoe u een belcurve maakt in Python
Hoe Z-scores in Python te berekenen