كيفية حساب درجات z في r


في الإحصائيات، تخبرنا النتيجة z عن عدد الانحرافات المعيارية للقيمة عن المتوسط. نستخدم الصيغة التالية لحساب درجة z:

ض = (X – μ) / σ

ذهب:

  • X هي قيمة بيانات أولية واحدة
  • μ هو متوسط عدد السكان
  • σ هو الانحراف المعياري للسكان

يشرح هذا البرنامج التعليمي كيفية حساب نقاط z لقيم البيانات الأولية في R.

المثال 1: إيجاد درجات Z لمتجه واحد

يوضح التعليمة البرمجية التالية كيفية العثور على درجة z لكل قيمة بيانات أولية في المتجه:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

تخبرنا كل درجة z بعدد الانحرافات المعيارية للقيمة الفردية عن المتوسط. على سبيل المثال:

  • قيمة البيانات الأولية الأولى “6” هي 1.323 انحراف معياري أقل من المتوسط.
  • قيمة البيانات الأولية الخامسة، “13”، هي 0 انحرافات معيارية عن المتوسط، أي أنها تساوي المتوسط.
  • أحدث قيمة للبيانات الأولية “22” هي 1.701 انحراف معياري فوق المتوسط.

المثال 2: البحث عن Z-Scores لعمود واحد في DataFrame

يوضح التعليمة البرمجية التالية كيفية العثور على درجة z لكل قيمة بيانات أولية في عمود واحد من إطار البيانات:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

تخبرنا كل درجة z بعدد الانحرافات المعيارية للقيمة الفردية عن المتوسط. على سبيل المثال:

  • قيمة البيانات الأولية الأولى “24” هي 0.619 انحراف معياري فوق المتوسط.
  • قيمة البيانات الأولية الثانية، “29”، هي 1.464 انحراف معياري فوق المتوسط.
  • قيمة البيانات الأولية الثالثة، “13”، هي 1.238 انحراف معياري أقل من المتوسط.

وما إلى ذلك وهلم جرا.

مثال 3: ابحث عن نقاط Z لكل عمود في DataFrame

يوضح التعليمة البرمجية التالية كيفية العثور على درجة z لكل قيمة بيانات أولية في كل عمود من إطار البيانات باستخدام الدالة sapply() .

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

يتم عرض الدرجات z لكل قيمة فردية بالنسبة إلى العمود الذي توجد فيه. على سبيل المثال:

  • القيمة الأولى للرقم “4” في العمود الأول هي 0.923 انحراف معياري أقل من القيمة المتوسطة لعمودها.
  • القيمة الأولى “24” في العمود الثاني هي 0.619 انحراف معياري فوق القيمة المتوسطة لعمودها.
  • القيمة الأولى للرقم “9” في العمود الثالث هي أقل بـ 0.904 انحراف معياري من القيمة المتوسطة لعمودها.

وما إلى ذلك وهلم جرا.

يمكنك العثور على المزيد من دروس R هنا .

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *