Cara menghitung deviasi standar di pandas: dengan contoh
Anda dapat menggunakan fungsi DataFrame.std() untuk menghitung standar deviasi nilai dalam pandas DataFrame.
Anda dapat menggunakan metode berikut untuk menghitung deviasi standar dalam praktiknya:
Metode 1: Hitung simpangan baku suatu kolom
df [ ' column_name ' ] . std ( )
Metode 2: Hitung simpangan baku beberapa kolom
df [[ ' column_name1 ', ' column_name2 '] ] . std ( )
Metode 3: Hitung simpangan baku semua kolom numerik
df . std ( )
Perhatikan bahwa fungsi std() akan secara otomatis mengabaikan nilai NaN apa pun di DataFrame saat menghitung deviasi standar.
Contoh berikut menunjukkan cara menggunakan setiap metode dengan pandas DataFrame berikut:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 to 25 5 11 1 to 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Metode 1: Hitung simpangan baku suatu kolom
Kode berikut menunjukkan cara menghitung deviasi standar kolom di DataFrame:
#calculate standard deviation of 'points' column df [ ' points ' ] . std ( ) 6.158617655657106
Simpangan bakunya ternyata 6,1586 .
Metode 2: Hitung simpangan baku beberapa kolom
Kode berikut menunjukkan cara menghitung deviasi standar beberapa kolom di DataFrame:
#calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()
points 6.158618
rebounds 2.559994
dtype:float64
Simpangan baku kolom “poin” adalah 6,1586 dan simpangan baku kolom “pantulan” adalah 2,5599 .
Metode 3: Hitung simpangan baku semua kolom numerik
Kode berikut menunjukkan cara menghitung deviasi standar setiap kolom numerik di DataFrame:
#calculate standard deviation of all numeric columns
df. std ()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64
Perhatikan bahwa panda tidak menghitung simpangan baku kolom “tim” karena ini bukan kolom numerik.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:
Cara menghitung rata-rata kolom di Pandas
Cara menghitung median kolom di Pandas
Cara menghitung nilai maksimum kolom di Pandas