Категорія: Гід

Кластеризація k-середніх у r: покроковий приклад

Кластеризація – це техніка машинного навчання, яка намагається знайти групи спостережень у наборі даних. Мета полягає в тому, щоб знайти такі кластери, щоб спостереження всередині кожного кластера були досить подібними одне до одного, тоді як спостереження в різних кластерах сильно відрізнялися...

Як обчислити дисперсію вибірки та сукупності в r

Дисперсія – це спосіб вимірювання того, наскільки добре значення даних розподілені навколо середнього. Формула для знаходження дисперсії генеральної сукупності така: σ 2 = Σ (x i – μ) 2 / N де μ — середнє значення сукупності, x i — i-...

K-medoids в r: покроковий приклад

Кластеризація – це техніка машинного навчання, яка намагається знайти групи або кластери спостережень у наборі даних. Мета полягає в тому, щоб знайти такі кластери, щоб спостереження всередині кожного кластера були досить подібними одне до одного, тоді як спостереження в різних кластерах...

Як обчислити студентські залишки в r

Залишок студента – це просто залишок, поділений на його оцінене стандартне відхилення. На практиці ми зазвичай кажемо, що будь-яке спостереження в наборі даних, залишкова оцінка якого перевищує абсолютне значення 3, є викидом. Ми можемо швидко отримати стьюдентизовані залишки будь-якої регресійної моделі...

Як обчислити студентські залишки в python

Залишок студента – це просто залишок, поділений на його оцінене стандартне відхилення. На практиці ми зазвичай кажемо, що будь-яке спостереження в наборі даних, залишкова оцінка якого перевищує абсолютне значення 3, є викидом. Ми можемо швидко отримати студентизовані залишки регресійної моделі в...

Як виконати перетворення бокса-кокса в python

Перетворення боксу-Кокса є широко використовуваним методом для перетворення ненормально розподіленого набору даних у більш нормально розподілений набір. Основна ідея цього методу полягає в тому, щоб знайти таке значення для λ, щоб перетворені дані були якнайближчими до нормального розподілу, використовуючи таку формулу:...

Як обчислити відстань до манхеттена в r (з прикладами)

Манхеттенська відстань між двома векторами, A і B , обчислюється наступним чином: Σ|a i – b i | де i – i -й елемент кожного вектора. Ця відстань використовується для вимірювання відмінності між будь-якими двома векторами та зазвичай використовується в багатьох...

Як обчислити відстань мінковського в r (з прикладами)

Відстань Мінковського між двома векторами, A і B , обчислюється наступним чином: (Σ|a i – b i | p ) 1/p де i — i -й елемент кожного вектора, а p — ціле число. Ця відстань використовується для вимірювання відмінності між...

Як інтерпретувати коди значення в r

Коли ви виконуєте регресійний аналіз або ANOVA в R, вихідні таблиці містять p-значення для змінних, які використовуються в аналізі, разом із відповідними кодами значущості . Ці коди значущості відображаються у вигляді серії зірочок або десяткової коми, якщо змінні є статистично значущими....

Як інтерпретувати результат регресії в r

Щоб підігнати модель лінійної регресії в R, ми можемо використати команду lm() . Щоб відобразити результат регресійної моделі, ми можемо використати команду summary() . У цьому посібнику пояснюється, як інтерпретувати кожне значення результату регресії в R. Приклад: інтерпретація результату регресії в...