Гид - Statorials

Как исправить: valueerror: индекс содержит повторяющиеся записи, его форму невозможно изменить.

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Ошибка, с которой вы можете столкнуться при использовании панд: ValueError : Index contains duplicate entries, cannot reshape Эта ошибка обычно возникает, когда вы пытаетесь изменить форму DataFrame pandas с помощью функции Pivot() , но в результирующем DataFrame имеется несколько значений, которые...

[Продолжить чтение...]

Как преобразовать datetime в строку в pandas (с примерами)

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий базовый синтаксис для преобразования столбца DateTime в строку в pandas: df[' column_name ']. dt . strftime (' %Y-%m-%d ') В следующем примере показано, как использовать этот синтаксис на практике. Пример: преобразование DateTime в строку в Pandas Допустим,...

[Продолжить чтение...]

Как рассчитать среднее значение выбранных столбцов в pandas

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Вы можете использовать следующие методы для расчета средних значений строк для выбранных столбцов в DataFrame pandas: Способ 1. Вычислите среднее значение строки для всех столбцов. df. mean (axis= 1 ) Способ 2: вычислить среднее значение строки для определенных столбцов df[[' col1...

[Продолжить чтение...]

Как сортировать по нескольким столбцам в pandas (с примерами)

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий базовый синтаксис для сортировки DataFrame pandas по нескольким столбцам: df = df. sort_values ([' column1 ', ' column2 '], ascending=( False , True )) В следующем примере показано, как использовать этот синтаксис на практике. Пример: сортировка по...

[Продолжить чтение...]

Pandas: как разделить dataframe по значению столбца

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Вы можете использовать следующий базовый синтаксис, чтобы разделить DataFrame pandas по значению столбца: #define value to split on x = 20 #define df1 as DataFrame where 'column_name' is >= 20 df1 = df[df[' column_name '] >= x] #define df2 as DataFrame...

[Продолжить чтение...]

Как выполнить тест уайта на python (шаг за шагом)

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Тест Уайта используется для определения наличия гетероскедастичности в регрессионной модели. Гетероскедастичность относится к неравномерной дисперсии остатков на разных уровнях переменной ответа , что нарушает предположение о том, что остатки одинаково разбросаны на каждом уровне переменной ответа. В следующем пошаговом примере показано,...

[Продолжить чтение...]

Как рассчитать взвешенное стандартное отклонение в python

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Взвешенное стандартное отклонение — это полезный способ измерения дисперсии значений в наборе данных, когда некоторые значения в наборе данных имеют более высокие веса, чем другие. Формула для расчета взвешенного стандартного отклонения: Золото: N: Общее количество наблюдений M: количество ненулевых весов. w...

[Продолжить чтение...]

Как выполнить тест на причинность грейнджера в python

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Тест причинности Грейнджера используется, чтобы определить, полезен ли один временной ряд для прогнозирования другого. В этом тесте используются следующие нулевые и альтернативные гипотезы: Нулевая гипотеза (H 0 ): временной ряд x не приводит к временному ряду y Грейнджеру. Альтернативная гипотеза (...

[Продолжить чтение...]

Как выполнить тест chow в python

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Тест Чоу используется для проверки того, равны ли коэффициенты двух разных моделей регрессии в разных наборах данных. Этот тест обычно используется в области эконометрики с данными временных рядов, чтобы определить, есть ли структурный разрыв в данных в данный момент времени. В...

[Продолжить чтение...]

Как выполнить тест отношения правдоподобия в python

К бенджамин андерсон 22 июля, 2023 Гид 0 комментариев

Тест отношения правдоподобия сравнивает степень соответствия двух вложенных регрессионных моделей . Вложенная модель — это просто модель, которая содержит подмножество переменных-предикторов в общей модели регрессии. Например, предположим, что у нас есть следующая модель регрессии с четырьмя переменными-предикторами: Y = β 0...

[Продолжить чтение...]

Рубрика: Гид