Cara menghitung deviasi standar di pandas: dengan contoh


Anda dapat menggunakan fungsi DataFrame.std() untuk menghitung standar deviasi nilai dalam pandas DataFrame.

Anda dapat menggunakan metode berikut untuk menghitung deviasi standar dalam praktiknya:

Metode 1: Hitung simpangan baku suatu kolom

 df [ ' column_name ' ] . std ( )

Metode 2: Hitung simpangan baku beberapa kolom

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Metode 3: Hitung simpangan baku semua kolom numerik

 df . std ( )

Perhatikan bahwa fungsi std() akan secara otomatis mengabaikan nilai NaN apa pun di DataFrame saat menghitung deviasi standar.

Contoh berikut menunjukkan cara menggunakan setiap metode dengan pandas DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Metode 1: Hitung simpangan baku suatu kolom

Kode berikut menunjukkan cara menghitung deviasi standar kolom di DataFrame:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

Simpangan bakunya ternyata 6,1586 .

Metode 2: Hitung simpangan baku beberapa kolom

Kode berikut menunjukkan cara menghitung deviasi standar beberapa kolom di DataFrame:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

Simpangan baku kolom “poin” adalah 6,1586 dan simpangan baku kolom “pantulan” adalah 2,5599 .

Metode 3: Hitung simpangan baku semua kolom numerik

Kode berikut menunjukkan cara menghitung deviasi standar setiap kolom numerik di DataFrame:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Perhatikan bahwa panda tidak menghitung simpangan baku kolom “tim” karena ini bukan kolom numerik.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Cara menghitung rata-rata kolom di Pandas
Cara menghitung median kolom di Pandas
Cara menghitung nilai maksimum kolom di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *