Часто ви можете замінити значення в одному або кількох стовпцях pandas DataFrame. На щастя, це легко зробити за допомогою функції .replace() . Цей підручник містить декілька прикладів практичного використання цієї функції на наступному DataFrame: import pandas as pd #createDataFrame df =...
Часто в статистиці ми хочемо перевірити, чи вірна гіпотеза щодо параметра сукупності . Наприклад, ми можемо припустити, що середня вага певної популяції черепах становить 300 фунтів. Щоб визначити, чи вірна ця гіпотеза, ми зберемо зразок черепах і зважимо кожну. Використовуючи ці...
Часто вам може знадобитися вибрати рядки в pandas DataFrame на основі їх значення індексу. Якщо ви хочете вибрати рядки на основі цілочисельного індексування, ви можете скористатися функцією .iloc . Якщо ви хочете вибрати рядки на основі індексування міток, ви можете скористатися...
Часто вам може знадобитися знайти максимальне значення для групи в pandas DataFrame. На щастя, це легко зробити за допомогою функцій groupby() і max() із таким синтаксисом: df. groupby (' column_name '). max () У цьому підручнику пояснюється кілька прикладів практичного використання...
Дизайн панелі з перехресним відставанням — це тип моделі структурного рівняння, який вимірює дві різні змінні в два моменти часу. Наприклад, припустімо, що ми вимірюємо загальну суму, витрачену на освіту, і середній дохід домогосподарства в певній країні в два різні періоди...
Коли два набори даних мають однакову довжину і кожне спостереження з одного набору даних може бути «парним» із спостереженням з іншого набору даних, ми називаємо це парними даними . Щоб зв’язати два набори даних, важливо, щоб кожне спостереження з одного набору...
Інтерполяція — це процес оцінювання невідомого значення функції між двома відомими значеннями. Враховуючи два відомих значення (x 1 , y 1 ) і (x 2 , y 2 ), ми можемо оцінити значення y для точки x за такою формулою: y...
Часто буває, що у вас є одне або кілька відсутніх значень у серії в Excel, які ви хотіли б заповнити. Найпростіший спосіб заповнити відсутні значення – скористатися функцією Fill Series в розділі Edit на вкладці Home . Цей підручник містить два...
Відносне стандартне відхилення — це міра стандартного відхилення вибірки від середнього значення для даного набору даних. Він розраховується таким чином: Відносне стандартне відхилення = s/ x * 100% золото: s: вибіркове стандартне відхилення x : вибірка середніх Цей показник дає нам...
Критерій Уайта використовується для визначення наявності гетероскедастичності в регресійній моделі. Гетероскедастичність відноситься до нерівномірної дисперсії залишків на різних рівнях змінної відповіді в регресійній моделі, що порушує одне з ключових припущень лінійної регресії про те, що залишки однаково розподілені на кожному рівні...