Come sottrarre due colonne in pandas dataframe


È possibile utilizzare la seguente sintassi per sottrarre una colonna da un’altra in un DataFrame panda:

 #subtract column 'B' from column 'A'
df[' AB '] = df. A - df. B

Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.

Esempio 1: sottrai due colonne in Pandas

Il codice seguente mostra come sottrarre una colonna da un’altra in un DataFrame panda e assegnare il risultato a una nuova colonna:

 import pandas as pd

#createDataFrame 
df = pd. DataFrame ({' A ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' B ': [5, 7, 8, 9, 12, 9, 12, 4],
                   ' C ': [11, 8, 10, 6, 6, 5, 9, 12]})

#subtract column B from column A
df[' AB '] = df. A - df. B

#view DataFrame
df

        A B C AB
0 25 5 11 20
1 12 7 8 5
2 15 8 10 7
3 14 9 6 5
4 19 12 6 7
5 23 9 5 14
6 25 12 9 13
7 29 4 12 25

La nuova colonna denominata ” AB ” visualizza i risultati della sottrazione dei valori nella colonna B dai valori nella colonna A.

Esempio 2: sottrai due colonne con valori mancanti

Se sottraiamo una colonna da un’altra in un DataFrame panda e in una delle colonne mancano valori, il risultato della sottrazione sarà sempre un valore mancante:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd. DataFrame ({' A ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' B ': [5, 7, np. no , 9, 12, np. no , 12, 4],
                   ' C ': [np. no , 8, 10, 6, 6, 5, 9, 12]}) 

#subtract column B from column A
df[' AB '] = df. A - df. B

#view DataFrame
df

	A B C AB
0 25 5.0 NaN 20.0
1 12 7.0 8.0 5.0
2 15 NaN 10.0 NaN
3 14 9.0 6.0 5.0
4 19 12.0 6.0 7.0
5 23 NaN 5.0 NaN
6 25 12.0 9.0 13.0
7 29 4.0 12.0 25.0

Se lo desideri, puoi sostituire tutti i valori mancanti nel dataFrame con zeri utilizzando la funzione df.fillna(0) prima di sottrarre una colonna da un’altra:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd. DataFrame ({' A ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' B ': [5, 7, np. no , 9, 12, np. no , 12, 4],
                   ' C ': [np. no , 8, 10, 6, 6, 5, 9, 12]}) 

#replace all missing values with zeros
df = df. fillna ( 0 )

#subtract column B from column A
df[' AB '] = df. A - df. B

#view DataFrame
df
	A B C AB
0 25 5.0 0.0 20.0
1 12 7.0 8.0 5.0
2 15 0.0 10.0 15.0
3 14 9.0 6.0 5.0
4 19 12.0 6.0 7.0
5 23 0.0 5.0 23.0
6 25 12.0 9.0 13.0
7 29 4.0 12.0 25.0

Risorse addizionali

Come aggiungere righe a un DataFrame Pandas
Come aggiungere un array Numpy a un DataFrame Pandas
Come contare il numero di righe in Pandas DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *