Python'da tek değişkenli analiz nasıl gerçekleştirilir: örneklerle


Tek değişkenli analiz terimi, bir değişkenin analizini ifade eder. Bunu “uni” ön ekinin “bir” anlamına gelmesinden dolayı hatırlayabilirsiniz.

Bir değişken üzerinde tek değişkenli analiz gerçekleştirmenin üç yaygın yolu vardır:

1. Özet İstatistikler – Değerlerin merkezini ve dağılımını ölçer.

2. Frekans Tablosu – Farklı değerlerin ne sıklıkla ortaya çıktığını açıklar.

3. Grafikler – Değerlerin dağılımını görselleştirmek için kullanılır.

Bu eğitimde aşağıdaki pandalar DataFrame ile tek değişkenli analizin nasıl gerçekleştirileceğine ilişkin bir örnek sunulmaktadır:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 6, 8, 8, 9, 3, 2, 6],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 6, 6, 7, 8, 7, 9, 15]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.0 5 11
1 1.0 7 8
2 2.0 7 10
3 3.5 9 6
4 4.0 12 6

1. Özet istatistikleri hesaplayın

DataFrame’deki “puan” değişkenine ilişkin çeşitli özet istatistikleri hesaplamak için aşağıdaki sözdizimini kullanabiliriz:

 #calculate mean of 'points'
df[' points ']. mean ()

5.706666666666667

#calculate median of 'points' 
df[' points ']. median () 

5.0

#calculate standard deviation of 'points'
df[' points ']. std () 

3.858287308169384

2. Frekans tablosu oluşturun

‘Noktalar’ değişkeni için bir frekans tablosu oluşturmak amacıyla aşağıdaki sözdizimini kullanabiliriz:

 #create frequency table for 'points'
df[' points ']. value_counts ()

4.0 3
1.0 2
5.0 2
2.0 1
3.5 1
6.5 1
7.0 1
7.4 1
8.0 1
13.0 1
14.2 1
Name: points, dtype: int64

Bu bize şunu söylüyor:

  • 4 değeri 3 kez görünüyor
  • 1 değeri iki kez görünüyor
  • 5 değeri iki kez görünüyor
  • 2 değeri 1 kez görünüyor

Ve benzeri.

İlgili: Python’da Frekans Tabloları Nasıl Oluşturulur

3. Grafikler Oluşturun

‘Noktalar’ değişkeni için bir kutu grafiği oluşturmak amacıyla aşağıdaki sözdizimini kullanabiliriz:

 import matplotlib. pyplot as plt

df. boxplot (column=[' points '], grid= False , color=' black ')

İlgili: Pandas DataFrame’den Kutu Grafiği Nasıl Oluşturulur

‘Noktalar’ değişkeni için bir histogram oluşturmak amacıyla aşağıdaki sözdizimini kullanabiliriz:

 import matplotlib. pyplot as plt

df. hist (column=' points ', grid= False , edgecolor=' black ')

İlgili: Pandas DataFrame’den Histogram Nasıl Oluşturulur

“Noktalar” değişkeni için bir yoğunluk eğrisi oluşturmak amacıyla aşağıdaki sözdizimini kullanabiliriz:

 import seaborn as sns

sns. kdeplot (df[' points '])

İlgili: Matplotlib’de Yoğunluk Grafiği Nasıl Oluşturulur

Bu grafiklerin her biri bize “puan” değişkeninin değerlerinin dağılımını görselleştirmenin benzersiz bir yolunu sunar.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir