Panda's: hoe maak je een kolom als deze niet bestaat
U kunt de volgende basissyntaxis gebruiken om een kolom in een Pandas DataFrame te maken als deze nog niet bestaat:
df[' my_column '] = df. get (' my_column ', df[' col1 '] * df[' col2 '])
Deze specifieke syntaxis maakt een nieuwe kolom met de naam my_column als deze nog niet bestaat in het DataFrame en wordt gedefinieerd als het product van de bestaande kolommen col1 en col2 .
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: maak een kolom in Pandas als deze niet bestaat
Stel dat we de volgende panda’s DataFrame hebben:
import pandas as pd #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12], ' sales ': [4, 6, 5, 8, 14, 13, 13, 12, 9, 8, 19, 14], ' price ': [1, 2, 2, 1, 2, 4, 4, 3, 3, 2, 2, 3]}) #view DataFrame print (df) day sales price 0 1 4 1 1 2 6 2 2 3 5 2 3 4 8 1 4 5 14 2 5 6 13 4 6 7 13 4 7 8 12 3 8 9 9 3 9 10 8 2 10 11 19 2 11 12 14 3
Laten we nu zeggen dat we proberen een kolom met de naam prijs toe te voegen als deze nog niet bestaat, en deze definiëren als een kolom waarin elke waarde 100 is:
#attempt to add column called 'price'
df[' price '] = df. get (' price ', 100)
#view updated DataFrame
print (df)
day sales price
0 1 4 1
1 2 6 2
2 3 5 2
3 4 8 1
4 5 14 2
5 6 13 4
6 7 13 4
7 8 12 3
8 9 9 3
9 10 8 2
10 11 19 2
11 12 14 3
Omdat er al een kolom met de naam prijs bestaat, voegt Panda deze eenvoudigweg niet toe aan het DataFrame.
Laten we echter zeggen dat we proberen een nieuwe kolom met de naam omzet toe te voegen als deze nog niet bestaat, en deze definiëren als een kolom waarin de waarden het product zijn van de verkoop- en prijskolommen:
#attempt to add column called 'revenue'
df[' revenue '] = df. get (' revenue ', df[' sales '] * df[' price '])
#view updated DataFrame
print (df)
day sales price revenue
0 1 4 1 4
1 2 6 2 12
2 3 5 2 10
3 4 8 1 8
4 5 14 2 28
5 6 13 4 52
6 7 13 4 52
7 8 12 3 36
8 9 9 3 27
9 10 8 2 16
10 11 19 2 38
11 12 14 3 42
Deze omzetkolom is toegevoegd aan het DataFrame omdat deze nog niet bestond.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:
Hoe rijen in Pandas DataFrame te verwijderen op basis van de voorwaarde
Hoe u een Pandas DataFrame op meerdere voorwaarden kunt filteren
Hoe u het “NIET IN”-filter in Pandas DataFrame gebruikt