Ви можете використовувати процедуру сортування в SAS, щоб швидко видалити повторювані рядки з набору даних. Ця процедура використовує такий базовий синтаксис: proc sort data =original_data out =no_dups_data nodupkey ; by _all_; run; Зауважте, що аргумент by визначає, які стовпці сканувати під...
Критерій Манна-Уїтні U (іноді його називають тестом рангової суми Вілкоксона) використовується для порівняння відмінностей між двома вибірками, коли розподіл вибірки не є нормальним, а розміри вибірки невеликі (n < 30). Він вважається непараметричним еквівалентом двовибіркового t-критерію . У цьому посібнику пояснюється,...
Розподіл Пуассона та нормальний розподіл є двома найбільш часто використовуваними розподілами ймовірностей у статистиці. Цей підручник містить швидке пояснення кожного дистрибутива, а також дві ключові відмінності між дистрибутивами. Огляд: розподіл Пуассона Розподіл Пуассона описує ймовірність отримання k успіхів протягом заданого інтервалу...
У статистиці квантильна нормалізація — це метод, який робить два розподіли ідентичними з точки зору статистичних властивостей. У наступному прикладі показано, як виконати квантильну нормалізацію в R. Приклад: квантильна нормалізація в R Припустімо, ми створюємо наступний кадр даних у R, який...
Щоб обчислити процентний ранг згрупованих даних, можна скористатися такою формулою: Процентиль рангу = L + (RN/100 – M) / F * C золото: L : нижня межа інтервалу, який містить ранг процентиля A : Процентиль рангу N : Загальна частота M...
Щоб обчислити процентиль нормального розподілу за середнього значення та стандартного відхилення, можна використати наступну формулу: Процентильне значення = μ + zσ золото: μ : Середній z : z-оцінка з таблиці z, яка відповідає значенню процентиля σ : стандартне відхилення Наведені нижче...
Функцію replace() в R можна використовувати для заміни певних елементів вектора новими значеннями. Ця функція використовує такий синтаксис: замінити (x, список, значення) золото: x : Ім’я вектора список : елементи для заміни values : Значення заміни Наступні приклади показують, як використовувати...
Проста лінійна регресія — це техніка, яку ми можемо використати, щоб зрозуміти взаємозв’язок між змінною предиктором і змінною відповіді . Ця техніка знаходить рядок, який найкраще «відповідає» даним і набуває такої форми: ŷ = b 0 + b 1 x золото:...
Ви можете використовувати proc sgplot для швидкого створення діаграми розсіювання з лінією регресії в SAS. Наступні приклади показують, як використовувати цю процедуру на практиці. Приклад 1: Створення основної діаграми розсіювання з лінією регресії У наступному коді показано, як створити базову діаграму...
Множинна лінійна регресія – це метод, який ми можемо використати для розуміння зв’язку між двома чи більше змінними предикторами та змінною відповіді . У цьому посібнику пояснюється, як виконувати множинну лінійну регресію в SAS. Крок 1: Створіть дані Припустімо, ми хочемо...