Çoğu zaman bir pandas DataFrame’in birden çok sütununu gruplamak ve toplamak isteyebilirsiniz. Neyse ki pandaların .groupby() ve .agg() işlevlerini kullanarak bunu yapmak kolaydır. Bu eğitimde bu işlevlerin pratik kullanımına ilişkin çeşitli örnekler açıklanmaktadır. Örnek 1: İki sütuna göre gruplandırın ve ortalamayı...
Çoğu zaman bir pandas DataFrame’deki bir veya daha fazla sütunun veri değerlerini normalleştirmek isteyebilirsiniz. Bu eğitimde bunu yapmanın iki yolu açıklanmaktadır: 1. Min-Maks normalizasyonu Amaç: Her veri değerini 0 ile 1 arasında bir değere dönüştürür. Formül: Yeni değer = (değer –...
Shapiro-Wilk testi bir normallik testidir. Bir örneğin normal dağılımdan gelip gelmediğini belirlemek için kullanılır. Python’da Shapiro-Wilk testi gerçekleştirmek için aşağıdaki sözdizimini kullanan scipy.stats.shapiro() işlevini kullanabiliriz: scipy.stats.shapiro(x) Altın: x: örnek veri tablosu. Bu fonksiyon bir test istatistiği ve buna karşılık gelen bir...
Kolmogorov-Smirnov testi, bir örneklemin belirli bir dağılımdan gelip gelmediğini test etmek için kullanılır. Python’da Kolmogorov-Smirnov testi gerçekleştirmek için, tek örnekli bir test için scipy.stats.kstest() veya iki örnekli bir test için scipy.stats.ks_2samp()’ ı kullanabiliriz. Bu eğitimde her fonksiyonun pratikte nasıl kullanılacağına dair...
Araştırmacılar genellikle bir popülasyondanörnekler alır ve bu örnekteki verileri, bir bütün olarak popülasyon hakkında sonuçlar çıkarmak için kullanır. Yaygın olarak kullanılan bir örnekleme yöntemi, bir popülasyonun gruplara ayrıldığı ve her gruptan belirli sayıda üyenin örneğe dahil edilmek üzere rastgele seçildiği tabakalı...
Genellikle üçüncü bir değişkene dayalı olarak matplotlib dağılım grafiğindeki noktaların rengini gölgelendirmek isteyebilirsiniz. Neyse ki, aşağıdaki sözdizimini alan matplotlib.pyplot.scatter() işlevini kullanarak bunu yapmak kolaydır: matplotlib.pyplot.scatter(x, y, s=Yok, c=Yok, cmap=Yok) Altın: x: Grafikteki x ekseninin konumları için kullanılacak değerler tablosu. y: çizimdeki...
Ortalama Karekök Hata (RMSE), tahmin edilen değerlerimizin bir modelde gözlemlenen değerlerimizden ortalama olarak ne kadar uzakta olduğunu bize söyleyen bir metriktir. Aşağıdaki şekilde hesaplanır: RMSE = √[ Σ(P ben – Ö ben ) 2 / n ] Altın: Σ “toplam” anlamına...
Çoğunlukla bir Matplotlib grafiğindeki çeşitli öğelerin yazı tipi boyutunu değiştirmek isteyebilirsiniz. Neyse ki, aşağıdaki kodu kullanarak bunu yapmak kolaydır: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10) #fontsize of the title plt. rc...
Kontur grafiği, konturları kullanarak üç boyutlu verileri iki boyutlu olarak görselleştirmemize olanak tanıyan bir çizim türüdür. Aşağıdaki iki işlevi kullanarak Matplotlib’de bir kontur grafiği oluşturabilirsiniz: matplotlib.pyplot.contour() – Kontur grafikleri oluşturur. matplotlib.pyplot.contourf() – Doldurulmuş kontur grafikleri oluşturur. Aşağıdaki örnekler bu iki fonksiyonun...
Çoğunlukla bir Matplotlib grafiğindeki bir veya daha fazla eksendeki onay işaretlerini kaldırmak isteyebilirsiniz. Neyse ki, bunu check_params() işlevini kullanarak yapmak kolaydır. Bu eğitimde, aşağıdaki dağılım grafiğine dayanarak bu özelliğin pratikte nasıl kullanılacağına ilişkin birkaç örnek gösterilmektedir: import matplotlib.pyplot as plt #createdata...