Genellikle R’deki bir veri çerçevesindeki belirli bir dizeyi içeren satırları filtrelemek isteyebilirsiniz. Neyse ki, dplyr paketindeki filter() işlevini ve Base R’deki grepl() işlevini kullanarak bunu yapmak kolaydır. Bu eğitimde, aşağıdaki veri çerçevesini kullanarak bu işlevlerin pratik kullanımına ilişkin birkaç örnek gösterilmektedir:...
İnsanların R’de sıklıkla karıştırdığı iki işlev grep() ve grepl()’ dir. Her iki işlev de bir dizede belirli bir modelin var olup olmadığını görmenize olanak tanır, ancak farklı sonuçlar döndürürler: grepl(), bir dizede bir model mevcut olduğunda TRUE değerini döndürür. grep() modeli...
Tibble , R’deki bir veri çerçevesinin yalnızca ilk 10 satırını görüntüleyen geliştirilmiş bir yazdırma yöntemine sahip bir veri çerçevesidir. Bu, büyük verilerle çalışmayı çok daha kolay hale getirir ve R’nin bir veri çerçevesindeki her satırı görüntülemeye çalışmasını engeller. Örneğin, 80 satır...
Genellikle R’deki bir veri çerçevesinin bir veya daha fazla sütunundaki değerlerin göreceli frekanslarını/oranlarını hesaplamak isteyebilirsiniz. Neyse ki dplyr paketindeki işlevleri kullanarak bunu yapmak kolaydır. Bu eğitimde, aşağıdaki veri çerçevesinde göreceli frekansları hesaplamak için bu işlevlerin nasıl kullanılacağı gösterilmektedir: #create data frame...
Genellikle R’deki bir veri çerçevesinde her grubun maksimum değerini bulmak isteyebilirsiniz. Neyse ki bunu dplyr paketindeki işlevleri kullanarak yapmak kolaydır. Bu eğitimde aşağıdaki veri çerçevesini kullanarak bunun nasıl yapılacağı açıklanmaktadır: #create data frame df <- data.frame(team = c('A', 'A', 'A', 'B',...
Çoğunlukla belirli koşullara dayalı olarak R’deki bir veri çerçevesinde yeni bir değişken oluşturmak isteyebilirsiniz. Neyse ki, dplyr paketindeki mutate() ve case_when() işlevlerini kullanarak bunu yapmak kolaydır. Bu eğitimde, bu işlevleri aşağıdaki veri çerçevesiyle kullanmanın birkaç örneği gösterilmektedir: #create data frame df...
Genellikle “IQR” olarak adlandırılan çeyrekler arası aralık , bir veri kümesinin ortadaki %50’lik kısmının dağılımını ölçmenin bir yoludur. Bir veri setinin ilk çeyreği* (yüzde 25’inci dilim) ile üçüncü çeyreği (yüzde 75’inci dilim) arasındaki fark olarak hesaplanır. Neyse ki Python’da bir veri...
Çoğu zaman, R’deki ggplot2 paketini kullanarak yan yana iki grafik oluşturmak isteyebilirsiniz. Neyse ki bunu patchwork paketinin yardımıyla yapmak kolaydır. #install ggplot2 and patchwork packages install.packages(' ggplot2 ') install.packages(' patchwork ') #load the packages library(ggplot2) library(patchwork) Bu eğitimde, yan yana grafikler...
Çoğunlukla ggplot2 kullanarak bir grafik üzerinde eksen sınırlarını ayarlamak isteyebilirsiniz. Aşağıdaki işlevleri kullanarak bunu kolayca yapabilirsiniz: xlim() : X ekseninin alt ve üst sınırını belirtir. ylim(): y ekseninin alt ve üst sınırını belirtir. Bu yöntemlerin her ikisinin de sınırların dışındaki verileri...
Bazen R’deki kutu grafiklerinden aykırı değerleri kaldırmak isteyebilirsiniz. Bu eğitimde bunun hem temel R hem de ggplot2 kullanılarak nasıl yapılacağı açıklanmaktadır. Base R’deki kutu grafiklerindeki aykırı değerleri kaldırın Aşağıdaki veri setine sahip olduğumuzu varsayalım: data <- c(5, 8, 8, 12, 14,...