Два терміни, які студенти часто плутають у статистиці, це стандартна помилка та похибка . Стандартна помилка вимірює точність оцінки середнього значення сукупності. Він розраховується таким чином: Стандартна похибка = s / √n золото: s: вибіркове стандартне відхилення n: розмір вибірки Похибка...
Парний графік — це матриця діаграми розсіювання, яка дозволяє зрозуміти попарний зв’язок між різними змінними в наборі даних. На щастя, легко створити діаграму пар у R за допомогою функції pairs() . Цей підручник містить кілька прикладів практичного використання цієї функції. Приклад...
Біноміальний розподіл описує ймовірність отримання k успіхів у n біноміальних експериментах. Якщо випадкова величина X відповідає біноміальному розподілу, то ймовірність успіху X = k можна знайти за такою формулою: P(X=k) = n C k * p k * (1-p) nk золото:...
Супутня змінна (іноді її називають «коваріатом») — це змінна, яка не становить основного інтересу в дослідженні, але яка, тим не менш, може певною мірою взаємодіяти зі змінною(ями), що представляє інтерес, що вивчається. Неврахування цих типів змінних може призвести до упереджених або...
Відносна частота вимірює, як часто певне значення з’являється в наборі даних відносно загальної кількості значень у наборі даних. Ви можете використовувати таку функцію в Python для обчислення відносних частот: def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for value in...
Довірчий інтервал – це діапазон значень, який, ймовірно, містить параметр сукупності з певним рівнем довіри. У цьому посібнику пояснюється, як побудувати довірчий інтервал для набору даних у R. Приклад: побудова довірчого інтервалу в R Припустімо, що ми маємо такий набір даних...
Часто, виконуючи просту лінійну регресію, ви можете створити діаграму розсіювання, щоб візуалізувати різні комбінації значень x і y, а також оцінену лінію регресії. На щастя, є два простих способи створити цей тип графіка в Python. Цей підручник пояснює обидва методи з...
Діаграма стебла та листя – це діаграма, яка відображає дані шляхом поділу кожного значення в наборі даних на стебло та лист . Це унікальний графік, оскільки він допомагає нам візуалізувати форму розподілу, одночасно відображаючи необроблені значення окремих даних. Цей підручник пояснює,...
Часто вам може знадобитися розташувати рядки кадру даних у R у певному порядку. На щастя, це легко зробити за допомогою функції arrange() із бібліотеки dplyr . Цей підручник пояснює кілька прикладів практичного використання цієї функції з використанням наступного кадру даних: #create...
Часто вам може бути цікаво підрахувати кількість спостережень на групу в R. На щастя, це легко зробити за допомогою функції count() бібліотеки dplyr . Цей підручник пояснює кілька прикладів практичного використання цієї функції з використанням наступного кадру даних: #create data frame...