Hoe de procentuele verandering bij panda's te berekenen


U kunt de functie pct_change() gebruiken om de procentuele verandering tussen waarden in panda’s te berekenen:

 #calculate percent change between values in pandas Series
s. pct_change ()

#calculate percent change between rows in pandas DataFrame
df[' column_name ']. pct_change ()

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Procentuele verandering in pandareeksen

De volgende code laat zien hoe u de procentuele verandering tussen waarden in een pandareeks berekent:

 import pandas as pd

#create pandas Series
s = pd. Series ([6, 14, 12, 18, 19])

#calculate percent change between consecutive values
s. pct_change () 

0 NaN
1 1.333333
2 -0.142857
3 0.500000
4 0.055556
dtype:float64

Hier ziet u hoe deze waarden werden berekend:

  • Index 1: (14 – 6) / 6 = 1,333333
  • Index 2: (12 – 14) / 14 = -.142857
  • Index 3: (18 – 12) / 12 = 0,5
  • Index 4: (19 – 18) / 18 = 0,055556

Merk op dat u het periodenargument ook kunt gebruiken om de procentuele verandering tussen waarden met verschillende intervallen te berekenen:

 import pandas as pd

#create pandas Series
s = pd. Series ([6, 14, 12, 18, 19])

#calculate percent change between values 2 positions apart
s. pct_change (periods= 2 ) 

0 NaN
1 NaN
2 1.000000
3 0.285714
4 0.583333
dtype:float64

Hier ziet u hoe deze waarden werden berekend:

  • Index 2: (12 – 6) / 6 = 1,000000
  • Index 3: (18 – 14) / 14 = 0,285714
  • Index 4: (19 – 12) / 12 = .583333

Voorbeeld 2: procentuele verandering in panda’s DataFrame

De volgende code laat zien hoe u de procentuele verandering tussen opeenvolgende rijen in een Panda DataFrame berekent:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' period ': [1, 2, 3, 4, 5],
                   ' sales ': [6, 7, 7, 9, 12]}) 

#view DataFrame
df

        period sales
0 1 6
1 2 7
2 3 7
3 4 9
4 5 12

#calculate percent change between consecutive values in 'sales' column
df[' sales_pct_change '] = df[' sales ']. pct_change ()

#view updated DataFrame
df

	period sales sales_pct_change
0 1 6 NaN
1 2 7 0.166667
2 3 7 0.000000
3 4 9 0.285714
4 5 12 0.333333

Hier ziet u hoe deze waarden werden berekend:

  • Index 1: (7 – 6) / 6 = .166667
  • Index 2: (7 – 7) / 7 = 0,000000
  • Index 3: (9 – 7) / 7 = .285714
  • Index 4: (12 – 9) / 9 = .333333

De volledige documentatie van de pct_change() functie vindt u hier .

Aanvullende bronnen

Hoe het gemiddelde van kolommen in Panda’s te berekenen
Hoe de mediaan in panda’s te berekenen
Hoe u een voortschrijdend gemiddelde in panda’s kunt berekenen
Hoe de glijdende correlatie bij panda’s te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert