كيفية حساب عدد التكرارات في الأعمدة في r


يمكنك استخدام بناء الجملة التالي في R لحساب عدد تكرارات قيم معينة في أعمدة إطار البيانات:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا مع إطار البيانات التالي:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

مثال 1: حساب تكرارات القيم في العمود

يوضح التعليمة البرمجية التالية كيفية حساب عدد مرات ظهور كل قيمة في عمود “الفريق”:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

هذا يخبرنا:

  • يظهر اسم الفريق “Mavs” مرتين.
  • يظهر اسم الفريق “نتس” 3 مرات.
  • يظهر اسم الفريق “Suns” مرة واحدة.

مثال 2: حساب تكرارات القيم في العمود (بما في ذلك قيم NA)

يوضح التعليمة البرمجية التالية كيفية حساب عدد تكرارات كل قيمة (بما في ذلك قيم NA) في عمود “النقاط”:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

هذا يخبرنا:

  • تظهر القيمة 20 مرة واحدة.
  • تظهر القيمة 22 مرة واحدة.
  • تظهر القيمة 26 مرة واحدة.
  • تظهر القيمة 30 مرتين.
  • تظهر قيمة NA (القيمة المفقودة) مرة واحدة.

مثال 3: حساب تكرارات قيمة محددة في العمود

الكود التالي يوضح كيفية حساب عدد مرات ظهور القيمة 30 في عمود “النقاط”:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

يخبرنا هذا أن القيمة 30 تظهر مرتين في عمود “النقاط”.

يمكنك أيضًا استخدام بناء الجملة التالي لحساب عدد تكرارات عدة قيم مختلفة في عمود “النقاط”:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

يخبرنا هذا أن القيمة 30 أو 26 تظهر 3 مرات إجمالاً في عمود “النقاط”.

مصادر إضافية

كيفية جمع أعمدة محددة في R
كيفية حساب متوسط أعمدة متعددة في R
كيفية العثور على القيمة القصوى عبر أعمدة متعددة في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *