Іноді вам може бути цікаво перекодувати певні значення у фрейм даних у R. На щастя, це можна легко зробити за допомогою функції recode() з пакету dplyr. Цей підручник демонструє кілька прикладів практичного використання цієї функції. Приклад 1: перекодуйте один стовпець у...
R-квадрат , який часто записують як r2 , є показником того, наскільки модель лінійної регресії відповідає набору даних. З технічної точки зору, це частка дисперсії у змінній відповіді, яку можна пояснити змінною предиктора. Значення r 2 може коливатися від 0 до...
Часто в статистиці перевірка гіпотези призводить до тестової статистики Т-балу. Як тільки ми знаходимо цей t-показник, ми зазвичай знаходимо пов’язане з ним значення p. Якщо це p-значення нижче певного альфа-рівня (наприклад, 0,10, 0,05, 0,01), тоді ми відхиляємо нульову гіпотезу тесту та...
Логарифмічний графік — це діаграма розсіювання, яка використовує логарифмічні масштаби на осях X і Y. Цей тип графіка корисний для візуалізації двох змінних, коли справжній зв’язок між ними відповідає степеневому закону. Це явище зустрічається в багатьох галузях реального життя, зокрема в...
Часто вам може знадобитися побудувати рівняння або функцію в Excel. На щастя, це легко зробити завдяки вбудованим формулам Excel. Цей підручник містить кілька прикладів того, як побудувати рівняння/функції в Excel. Приклад 1: Складання лінійного рівняння Припустімо, ви хочете побудувати таке рівняння:...
Часто ви можете додати смужки похибок до графіків у Python, щоб зафіксувати невизначеність вимірювань або обчислених значень. На щастя, це легко зробити за допомогою бібліотеки matplotlib. У цьому підручнику пояснюється, як додати смужки помилок до гістограм і лінійних діаграм у Python....
Часто ви можете створити новий стовпець у pandas DataFrame на основі певних умов. У цьому посібнику наведено кілька прикладів того, як це зробити за допомогою такого DataFrame: import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({'rating':...
Іноді ви можете додати порожній стовпець до pandas DataFrame. На щастя, це досить просто зробити, і цей підручник показує кілька прикладів того, як це зробити за допомогою таких pandas DataFrame: import numpy as np import pandas as pd #createDataFrame df =...
У статистиці z-показник говорить нам, скільки стандартних відхилень має значення від середнього. Ми використовуємо наступну формулу для розрахунку z-показника: z = (X – μ) / σ золото: X – це одне значення необроблених даних μ – середнє значення сукупності σ —...
У статистиці ми часто використовуємо коефіцієнт кореляції Пірсона для вимірювання лінійної залежності між двома змінними. Однак інколи ми хочемо зрозуміти зв’язок між двома змінними , контролюючи третю змінну . Наприклад, припустімо, що ми хочемо виміряти зв’язок між кількістю годин навчання студента...