Pandalar: her satır için standart sapma nasıl hesaplanır

İle Dr.benjamin anderson Temmuz 13, 2023 Rehber 0 Yorum

Bir panda DataFrame’in her satırına ilişkin değerlerin standart sapmasını hesaplamak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df. std (axis= 1 , numeric_only= True )

axis=1 argümanı pandalara her satır için (her sütun yerine) hesaplama yapmasını söyler ve numeric_only=True pandalara hesaplamayı gerçekleştirirken yalnızca sayısal sütunları dikkate almasını söyler.

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Pandalar’daki her satır için standart sapmayı hesaplama

Dört farklı oyun sırasında çeşitli basketbol oyuncularının attığı puanlar hakkında bilgi içeren aşağıdaki panda DataFrame’e sahip olduğumuzu varsayalım:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' game4 ': [9, 8, 8, 9, 14, 15, 10, 11]})
                   
#view DataFrame
print (df)

  player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 8
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11

Her oyuncunun attığı puanların standart sapmasını hesaplamak için aşağıdaki sözdizimini kullanabiliriz:

 #calculate standard deviation for each row
df. std (axis= 1 , numeric_only= True )

0 5.439056
1 7.182154
2 5.477226
3 3.316625
4 3.785939
5 4.163332
6 5.354126
7 10.144785
dtype:float64

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

A oyuncusunun attığı puanların standart sapması 5,439’dur .
B oyuncusunun attığı puanların standart sapması 7,182’dir .
C oyuncusunun attığı puanların standart sapması 5.477’dir .

Ve benzeri.

Std() fonksiyonunun örnek standart sapmasını varsayılan olarak hesapladığını unutmayın.

Bunun yerine popülasyon standart sapmasını hesaplamak istiyorsanız ddof=0 bağımsız değişkenini kullanmanız gerekir:

 #calculate population standard deviation for each row
df. std (axis= 1 , ddof= 0 , numeric_only= True )

0 4.747351
1 5.881366
2 4.807037
3 3.384910
4 3.983518
5 3.915150
6 4.892772
7 8.091179
dtype:float64

İlgili: Nüfus vs. Örnek Standart Sapma: Her Biri Ne Zaman Kullanılmalı

Yeni bir sütuna standart sapma değerleri atamak için aşağıdaki sözdizimini kullanabilirsiniz:

 #add new column to display standard deviation for each row
df[' std_points '] = df. std (axis= 1 , numeric_only= True )

#view updated DataFrame
print (df)

  player game1 game2 game3 game4 points_std
0 A 18 5 11 9 5.439056
1 B 22 7 8 8 7.182154
2 C 19 7 10 8 5.477226
3 D 14 9 6 9 3.316625
4 E 14 12 6 14 3.785939
5 F 11 9 5 15 4.163332
6 G 20 9 9 10 5.354126
7:28 AM 4 12 11 10.144785

game1 , game2 , game3 ve game4 sütunlarındaki her satıra ilişkin değerlerin standart sapması artık point_std sütununda görüntüleniyor.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandas DataFrame’in ilk satırı nasıl alınır
Pandas DataFrame’de ilk satır nasıl kaldırılır
Pandas DataFrame’e satır nasıl eklenir

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek: Pandalar’daki her satır için standart sapmayı hesaplama

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle