Panda's: beschrijven() gebruiken en wetenschappelijke notatie verwijderen


U kunt de functie beschrijven() gebruiken om beschrijvende statistieken te genereren voor variabelen in een pandas DataFrame.

Om de wetenschappelijke notatie uit de uitvoer van de functie beschrijven() te verwijderen, kunt u de volgende methoden gebruiken:

Methode 1: Verwijder de wetenschappelijke notatie bij gebruik van write() met een kolom

 df[' my_column ']. describe (). apply ( lambda x: format (x, ' f '))

Methode 2: Verwijder de wetenschappelijke notatie bij gebruik van write() met meerdere kolommen

 df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' sales ': [8450550, 406530, 53000, 6000, 2000, 4000, 5400, 6500],
                   ' returns ':[2212200, 145200, 300, 2500, 700, 600, 800, 1200]})

#view DataFrame
print (df)

  store sales returns
0 A 8450550 2212200
1 A 406530 145200
2 A 53000 300
3 A 6000 2500
4 B 2000 700
5 B 4000 600
6 B 5400 800
7 B 6500 1200

Voorbeeld 1: Verwijder de wetenschappelijke notatie bij gebruik van write() met een kolom

Als we de functie beschrijven() gebruiken om beschrijvende statistieken voor de verkoopkolom te berekenen, worden de uitvoerwaarden weergegeven in wetenschappelijke notatie:

 #calculate descriptive statistics for sales column
df[' sales ']. describe ()

count 8.000000e+00
mean 1.116748e+06
std 2.966552e+06
min 2.000000e+03
25% 5.050000e+03
50% 6.250000e+03
75% 1.413825e+05
max 8.450550e+06
Name: sales, dtype: float64

Merk op dat elk van de uitvoerwaarden wordt weergegeven met behulp van wetenschappelijke notatie.

We kunnen de volgende syntaxis gebruiken om de wetenschappelijke notatie uit de uitvoer te verwijderen:

 #calculate descriptive statistics for sales column and suppress scientific notation
df[' sales ']. describe (). apply ( lambda x: format (x, ' f '))

count 8.000000
mean 1116747.500000
std 2966551.594104
min 2000.000000
25% 5050.000000
50% 6250.000000
75% 141382.500000
max 8450550.000000
Name: sales, dtype: object

Merk op dat de waarden in de uitvoer nu worden weergegeven zonder wetenschappelijke notatie.

Voorbeeld 2: Verwijder de wetenschappelijke notatie bij gebruik van write() met meerdere kolommen

Als we de functie beschrijven() gebruiken om beschrijvende statistieken voor elke numerieke kolom te berekenen, worden de uitvoerwaarden weergegeven in wetenschappelijke notatie:

 #calculate descriptive statistics for each numeric column
df. describe ()

               sales returns
count 8.000000e+00 8.000000e+00
mean 1.116748e+06 2.954375e+05
std 2.966552e+06 7.761309e+05
min 2.000000e+03 3.000000e+02
25% 5.050000e+03 6.750000e+02
50% 6.250000e+03 1.000000e+03
75% 1.413825e+05 3.817500e+04
max 8.450550e+06 2.212200e+06

Merk op dat elk van de uitvoerwaarden wordt weergegeven met behulp van wetenschappelijke notatie.

We kunnen de volgende syntaxis gebruiken om de wetenschappelijke notatie uit de uitvoer te verwijderen:

 #calculate descriptive statistics for numerical columns and suppress scientific notation
df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))

                sales returns
count 8.00000 8.00000
mean 1116747.50000 295437.50000
std 2966551.59410 776130.93692
min 2000.00000 300.00000
25% 5050.00000 675.00000
50% 6250.00000 1000.00000
75% 141382.50000 38175.00000
max 8450550.00000 2212200.00000

Merk op dat de waarden in de uitvoer nu worden weergegeven zonder wetenschappelijke notatie.

Merk op dat we in dit voorbeeld 0:.5f hebben gebruikt om 5 decimalen in de uitvoer weer te geven.

Voel je vrij om de 5 te vervangen door een ander getal om een ander aantal decimalen weer te geven.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Panda’s: hoe bereken je de cumulatieve som per groep
Panda’s: unieke waarden per groep tellen
Panda’s: hoe de correlatie per groep te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert