Помилка, з якою ви можете зіткнутися під час використання панд: KeyError : "['Label'] not found in axis" Ця помилка зазвичай виникає, коли ви намагаєтеся видалити стовпець із pandas DataFrames і забуваєте вказати axis=1 . За замовчуванням аргумент осі має значення 0...
Помилка, з якою ви можете зіткнутися під час використання панд: ValueError : Index contains duplicate entries, cannot reshape Ця помилка зазвичай виникає, коли ви намагаєтеся змінити форму pandas DataFrame за допомогою функції pivot() , але в отриманому DataFrame є кілька значень,...
Ви можете використовувати такий базовий синтаксис, щоб перетворити стовпець DateTime на рядок у pandas: df[' column_name ']. dt . strftime (' %Y-%m-%d ') У наступному прикладі показано, як використовувати цей синтаксис на практиці. Приклад: перетворення DateTime на String у Pandas Скажімо,...
Ви можете використовувати такі методи, щоб обчислити середні значення рядків для вибраних стовпців у pandas DataFrame: Спосіб 1: обчисліть середнє значення рядка для всіх стовпців df. mean (axis= 1 ) Спосіб 2. Обчисліть середнє значення рядка для певних стовпців df[[' col1...
Ви можете використовувати такий базовий синтаксис, щоб сортувати pandas DataFrame за кількома стовпцями: df = df. sort_values ([' column1 ', ' column2 '], ascending=( False , True )) У наступному прикладі показано, як використовувати цей синтаксис на практиці. Приклад: сортування за...
Ви можете використовувати наступний базовий синтаксис, щоб розділити pandas DataFrame за значенням стовпця: #define value to split on x = 20 #define df1 as DataFrame where 'column_name' is >= 20 df1 = df[df[' column_name '] >= x] #define df2 as DataFrame...
Критерій Уайта використовується для визначення наявності гетероскедастичності в регресійній моделі. Гетероскедастичність відноситься до нерівномірної дисперсії залишків на різних рівнях змінної відповіді , що порушує припущення , що залишки однаково розподілені на кожному рівні змінної відповіді. Наступний покроковий приклад показує, як виконати...
Зважене стандартне відхилення є корисним способом вимірювання дисперсії значень у наборі даних, коли деякі значення в наборі даних мають вищу вагу, ніж інші. Формула для обчислення зваженого стандартного відхилення: золото: N: Загальна кількість спостережень M: кількість ненульових ваг w i :...
Тест причинності Грейнджера використовується для визначення того, чи корисний один часовий ряд для прогнозування іншого. Цей тест використовує такі нульові та альтернативні гіпотези: Нульова гіпотеза (H 0 ): часовий ряд x не викликає часовий ряд y до Грейнджера Альтернативна гіпотеза (...
Тест Чоу використовується, щоб перевірити, чи рівні коефіцієнти двох різних регресійних моделей на різних наборах даних. Цей тест зазвичай використовується в галузі економетрики з даними часових рядів, щоб визначити, чи існує структурний розрив у даних у певний момент часу. Наступний покроковий...