Як розрахувати z бали в r


У статистиці z-показник говорить нам, скільки стандартних відхилень має значення від середнього. Ми використовуємо наступну формулу для розрахунку z-показника:

z = (X – μ) / σ

золото:

  • X – це одне значення необроблених даних
  • μ – середнє значення сукупності
  • σ — стандартне відхилення сукупності

У цьому підручнику пояснюється, як обчислити z-показники для значень необроблених даних у R.

Приклад 1: визначення Z-показників для одного вектора

Наступний код показує, як знайти z-показник для кожного значення необроблених даних у векторі:

 #create vector of data
data <- c(6, 7, 7, 12, 13, 13, 15, 16, 19, 22)

#find z-score for each data value 
z_scores <- (data-mean(data))/sd(data)

#display z-scores
z_scores

[1] -1.3228757 -1.1338934 -1.1338934 -0.1889822 0.0000000 0.0000000
[7] 0.3779645 0.5669467 1.1338934 1.7008401

Кожен z-показник говорить нам, скільки стандартних відхилень має окреме значення від середнього. Наприклад:

  • Значення перших необроблених даних «6» на 1,323 стандартних відхилень нижче середнього.
  • П’яте значення необроблених даних, «13», становить 0 стандартних відхилень від середнього, тобто дорівнює середньому.
  • Останнє значення вихідних даних «22» на 1,701 стандартного відхилення вище середнього.

Приклад 2: Знайдіть Z-показники для одного стовпця в DataFrame

У наступному коді показано, як знайти z-показник для кожного значення необроблених даних в одному стовпці кадру даних:

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-score for each data value in the 'points' column
z_scores <- (df$points-mean(df$points))/sd(df$points)

#display z-scores
z_scores

[1] 0.6191904 1.4635409 -1.2383807 -0.9006405 -0.2251601 0.2814502

Кожен z-показник говорить нам, скільки стандартних відхилень має окреме значення від середнього. Наприклад:

  • Перше значення необроблених даних «24» становить 0,619 стандартних відхилень вище середнього.
  • Друге необроблене значення даних, «29», на 1,464 стандартних відхилень вище середнього.
  • Третє вихідне значення даних, «13», на 1,238 стандартних відхилень нижче середнього.

І так далі.

Приклад 3: Знайдіть Z-показники для кожного стовпця у DataFrame

У наступному коді показано, як знайти z-показник для кожного значення необроблених даних у кожному стовпці кадру даних за допомогою функції sapply() .

 #create dataframe
df <- data.frame(assists = c(4, 4, 6, 7, 9, 13),
                 points = c(24, 29, 13, 15, 19, 22),
                 rebounds = c(5, 5, 7, 8, 14, 15))

#find z-scores of each column
sapply(df, function(df) (df-mean(df))/sd(df))

         assists points rebounds
[1,] -0.92315712 0.6191904 -0.9035079
[2,] -0.92315712 1.4635409 -0.9035079
[3,] -0.34011052 -1.2383807 -0.4517540
[4,] -0.04858722 -0.9006405 -0.2258770
[5,] 0.53445939 -0.2251601 1.1293849
[6,] 1.70055260 0.2814502 1.3552619

Z-оцінки для кожного окремого значення відображаються відносно стовпця, у якому вони розташовані. Наприклад:

  • Перше значення «4» у першому стовпчику на 0,923 стандартних відхилень нижче середнього значення його стовпця.
  • Перше значення «24» у другому стовпці становить 0,619 стандартних відхилень вище середнього значення його стовпця.
  • Перше значення «9» у третьому стовпчику на 0,904 стандартного відхилення нижче середнього значення його стовпця.

І так далі.

Ви можете знайти більше навчальних посібників з R тут .

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *