Як розрахувати z бали в r

за Редакція 28 Липня, 2023 Гід 0 коментарів

У статистиці z-показник говорить нам, скільки стандартних відхилень має значення від середнього. Ми використовуємо наступну формулу для розрахунку z-показника:

z = (X – μ) / σ

золото:

X – це одне значення необроблених даних
μ – середнє значення сукупності
σ — стандартне відхилення сукупності

У цьому підручнику пояснюється, як обчислити z-показники для значень необроблених даних у R.

Приклад 1: визначення Z-показників для одного вектора

Наступний код показує, як знайти z-показник для кожного значення необроблених даних у векторі:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Кожен z-показник говорить нам, скільки стандартних відхилень має окреме значення від середнього. Наприклад:

Значення перших необроблених даних «6» на 1,323 стандартних відхилень нижче середнього.
П’яте значення необроблених даних, «13», становить 0 стандартних відхилень від середнього, тобто дорівнює середньому.
Останнє значення вихідних даних «22» на 1,701 стандартного відхилення вище середнього.

Приклад 2: Знайдіть Z-показники для одного стовпця в DataFrame

У наступному коді показано, як знайти z-показник для кожного значення необроблених даних в одному стовпці кадру даних:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

Кожен z-показник говорить нам, скільки стандартних відхилень має окреме значення від середнього. Наприклад:

Перше значення необроблених даних «24» становить 0,619 стандартних відхилень вище середнього.
Друге необроблене значення даних, «29», на 1,464 стандартних відхилень вище середнього.
Третє вихідне значення даних, «13», на 1,238 стандартних відхилень нижче середнього.

І так далі.

Приклад 3: Знайдіть Z-показники для кожного стовпця у DataFrame

У наступному коді показано, як знайти z-показник для кожного значення необроблених даних у кожному стовпці кадру даних за допомогою функції sapply() .

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Z-оцінки для кожного окремого значення відображаються відносно стовпця, у якому вони розташовані. Наприклад:

Перше значення «4» у першому стовпчику на 0,923 стандартних відхилень нижче середнього значення його стовпця.
Перше значення «24» у другому стовпці становить 0,619 стандартних відхилень вище середнього значення його стовпця.
Перше значення «9» у третьому стовпчику на 0,904 стандартного відхилення нижче середнього значення його стовпця.

І так далі.

Ви можете знайти більше навчальних посібників з R тут .

Про автора

Редакція

Привіт, я Бенджамін, професор статистики на пенсії, який став викладачем статистики. Маючи великий досвід і знання в галузі статистики, я готовий поділитися своїми знаннями, щоб розширити можливості студентів через Statorials. Дізнайтеся більше

Приклад 1: визначення Z-показників для одного вектора

Приклад 2: Знайдіть Z-показники для одного стовпця в DataFrame

Приклад 3: Знайдіть Z-показники для кожного стовпця у DataFrame

Про автора

Редакція

Додати коментар