Категорія: Гід

Як виправити в pandas: keyerror: “['label'] not found in axis”

Помилка, з якою ви можете зіткнутися під час використання панд: KeyError : "['Label'] not found in axis" Ця помилка зазвичай виникає, коли ви намагаєтеся видалити стовпець із pandas DataFrames і забуваєте вказати axis=1 . За замовчуванням аргумент осі має значення 0...

Як виправити: valueerror: індекс містить повторювані записи, не можна змінити форму

Помилка, з якою ви можете зіткнутися під час використання панд: ValueError : Index contains duplicate entries, cannot reshape Ця помилка зазвичай виникає, коли ви намагаєтеся змінити форму pandas DataFrame за допомогою функції pivot() , але в отриманому DataFrame є кілька значень,...

Як перетворити datetime на рядок у pandas (з прикладами)

Ви можете використовувати такий базовий синтаксис, щоб перетворити стовпець DateTime на рядок у pandas: df[' column_name ']. dt . strftime (' %Y-%m-%d ') У наступному прикладі показано, як використовувати цей синтаксис на практиці. Приклад: перетворення DateTime на String у Pandas Скажімо,...

Як обчислити середнє значення вибраних стовпців у pandas

Ви можете використовувати такі методи, щоб обчислити середні значення рядків для вибраних стовпців у pandas DataFrame: Спосіб 1: обчисліть середнє значення рядка для всіх стовпців df. mean (axis= 1 ) Спосіб 2. Обчисліть середнє значення рядка для певних стовпців df[[' col1...

Як сортувати за кількома стовпцями в pandas (з прикладами)

Ви можете використовувати такий базовий синтаксис, щоб сортувати pandas DataFrame за кількома стовпцями: df = df. sort_values ([' column1 ', ' column2 '], ascending=( False , True )) У наступному прикладі показано, як використовувати цей синтаксис на практиці. Приклад: сортування за...

Pandas: як розділити dataframe за значенням стовпця

Ви можете використовувати наступний базовий синтаксис, щоб розділити pandas DataFrame за значенням стовпця: #define value to split on x = 20 #define df1 as DataFrame where 'column_name' is >= 20 df1 = df[df[' column_name '] >= x] #define df2 as DataFrame...

Як виконати тест уайта в python (крок за кроком)

Критерій Уайта використовується для визначення наявності гетероскедастичності в регресійній моделі. Гетероскедастичність відноситься до нерівномірної дисперсії залишків на різних рівнях змінної відповіді , що порушує припущення , що залишки однаково розподілені на кожному рівні змінної відповіді. Наступний покроковий приклад показує, як виконати...

Як обчислити зважене стандартне відхилення в python

Зважене стандартне відхилення є корисним способом вимірювання дисперсії значень у наборі даних, коли деякі значення в наборі даних мають вищу вагу, ніж інші. Формула для обчислення зваженого стандартного відхилення: золото: N: Загальна кількість спостережень M: кількість ненульових ваг w i :...

Як виконати тест причинності грейнджера в python

Тест причинності Грейнджера використовується для визначення того, чи корисний один часовий ряд для прогнозування іншого. Цей тест використовує такі нульові та альтернативні гіпотези: Нульова гіпотеза (H 0 ): часовий ряд x не викликає часовий ряд y до Грейнджера Альтернативна гіпотеза (...

Як виконати тест chow в python

Тест Чоу використовується, щоб перевірити, чи рівні коефіцієнти двох різних регресійних моделей на різних наборах даних. Цей тест зазвичай використовується в галузі економетрики з даними часових рядів, щоб визначити, чи існує структурний розрив у даних у певний момент часу. Наступний покроковий...