كيفية حساب درجات z في r
في الإحصائيات، تخبرنا النتيجة z عن عدد الانحرافات المعيارية للقيمة عن المتوسط. نستخدم الصيغة التالية لحساب درجة z:
ض = (X – μ) / σ
ذهب:
- X هي قيمة بيانات أولية واحدة
- μ هو متوسط عدد السكان
- σ هو الانحراف المعياري للسكان
يشرح هذا البرنامج التعليمي كيفية حساب نقاط z لقيم البيانات الأولية في R.
المثال 1: إيجاد درجات Z لمتجه واحد
يوضح التعليمة البرمجية التالية كيفية العثور على درجة z لكل قيمة بيانات أولية في المتجه:
#create vector of data data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22) #find z-score for each data value z_scores <- (data-mean(data))/sd(data) #display z-scores z_scores [1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000 [7] 0.3779645 0.5669467 1.1338934 1.7008401
تخبرنا كل درجة z بعدد الانحرافات المعيارية للقيمة الفردية عن المتوسط. على سبيل المثال:
- قيمة البيانات الأولية الأولى “6” هي 1.323 انحراف معياري أقل من المتوسط.
- قيمة البيانات الأولية الخامسة، “13”، هي 0 انحرافات معيارية عن المتوسط، أي أنها تساوي المتوسط.
- أحدث قيمة للبيانات الأولية “22” هي 1.701 انحراف معياري فوق المتوسط.
المثال 2: البحث عن Z-Scores لعمود واحد في DataFrame
يوضح التعليمة البرمجية التالية كيفية العثور على درجة z لكل قيمة بيانات أولية في عمود واحد من إطار البيانات:
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-score for each data value in the 'points' column z_scores <- (df$points-mean(df$points))/sd(df$points) #display z-scores z_scores [1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502
تخبرنا كل درجة z بعدد الانحرافات المعيارية للقيمة الفردية عن المتوسط. على سبيل المثال:
- قيمة البيانات الأولية الأولى “24” هي 0.619 انحراف معياري فوق المتوسط.
- قيمة البيانات الأولية الثانية، “29”، هي 1.464 انحراف معياري فوق المتوسط.
- قيمة البيانات الأولية الثالثة، “13”، هي 1.238 انحراف معياري أقل من المتوسط.
وما إلى ذلك وهلم جرا.
مثال 3: ابحث عن نقاط Z لكل عمود في DataFrame
يوضح التعليمة البرمجية التالية كيفية العثور على درجة z لكل قيمة بيانات أولية في كل عمود من إطار البيانات باستخدام الدالة sapply() .
#create dataframe df <- data.frame(assists = c(4, 4, 6, 7, 9, 13), points = c(24, 29, 13, 15, 19, 22), rebounds = c(5, 5, 7, 8, 14, 15)) #find z-scores of each column sapply(df, function(df) (df-mean(df))/sd(df)) assists points rebounds [1,] -0.92315712 0.6191904 -0.9035079 [2,] -0.92315712 1.4635409 -0.9035079 [3,] -0.34011052 -1.2383807 -0.4517540 [4,] -0.04858722 -0.9006405 -0.2258770 [5,] 0.53445939 -0.2251601 1.1293849 [6,] 1.70055260 0.2814502 1.3552619
يتم عرض الدرجات z لكل قيمة فردية بالنسبة إلى العمود الذي توجد فيه. على سبيل المثال:
- القيمة الأولى للرقم “4” في العمود الأول هي 0.923 انحراف معياري أقل من القيمة المتوسطة لعمودها.
- القيمة الأولى “24” في العمود الثاني هي 0.619 انحراف معياري فوق القيمة المتوسطة لعمودها.
- القيمة الأولى للرقم “9” في العمود الثالث هي أقل بـ 0.904 انحراف معياري من القيمة المتوسطة لعمودها.
وما إلى ذلك وهلم جرا.
يمكنك العثور على المزيد من دروس R هنا .