Hoe een cdf in python te berekenen en uit te zetten


U kunt de volgende basissyntaxis gebruiken om de cumulatieve distributiefunctie (CDF) in Python te berekenen:

 #sortdata
x = np. sort (data)

#calculate CDF values
y = 1. * np. range (len(data)) / (len(data) - 1)

#plot CDF
plt. plot (x, y)

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: CDF met willekeurige distributie

De volgende code laat zien hoe u een cumulatieve distributiefunctie (CDF) voor een willekeurige steekproef van gegevens in Python kunt berekenen en plotten:

 import numpy as np
import matplotlib. pyplot as plt

#define random sample of data
data = np. random . rann (10000)

#sortdata
x = np. sort (data)

#calculate CDF values
y = 1. * np. range (len(data)) / (len(data) - 1)

#plot CDF
plt. plot (x, y)
plt. xlabel (' x ')

Op de x-as worden de ruwe gegevenswaarden weergegeven en op de y-as de bijbehorende CDF-waarden.

Voorbeeld 2: CDF met normale verdeling

Als u de cumulatieve verdelingsfunctie van een bekende verdeling (zoals de normale verdeling ) wilt plotten, kunt u de volgende functies uit de SciPy- bibliotheek gebruiken:

 import numpy as np
import scipy
import matplotlib. pyplot as plt

#generate data from normal distribution
data = np. random . rann (1000)

#sortdata
x = np. sort (data)

#calculate CDF values
y = scipy. stats . norm . cdf (x)

#plot CDF
plt. plot (data_sorted, norm_cdf)

#plot CDF
plt. plot (x, y)
plt. xlabel (' x ') 

Aanvullende bronnen

CDF of PDF: wat is het verschil?
Hoe u een belcurve maakt in Python
Hoe Z-scores in Python te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert