Рубрика: Гид

Как рассчитать процентильный ранг в pandas (с примерами)

Процентильный ранг значения сообщает нам процент значений в наборе данных, ранг которых равен или ниже заданного значения. Вы можете использовать следующие методы для расчета процентиля в пандах: Метод 1: вычислить процентильный ранг для столбца df[' percent_rank '] = df[' some_column ']....

Pandas: как построить несколько dataframes на подзаголовках

Вы можете использовать следующий базовый синтаксис для построения нескольких кадров данных pandas в подграфиках: import matplotlib. pyplot as plt #define subplot layout fig, axes = plt. subplots (nrows= 2 , ncols= 2 ) #add DataFrames to subplots df1. plot (ax=axes[0,0]) df2....

Панды: как использовать описать() по группе

Вы можете использовать функцию define() для создания описательной статистики для переменных в DataFrame pandas. Вы можете использовать следующий базовый синтаксис для использования функции define() с функцией groupby() в pandas: df. groupby (' group_var ')[' values_var ']. describe () В следующем примере...

Как создать 3d dataframe pandas (с примером)

Вы можете использовать модуль xarray для быстрого создания 3D-фрейма данных pandas. В этом руководстве объясняется, как создать следующий 3D DataFrame pandas с использованием функций модуля xarray: product_A product_B product_C year quarter 2021 Q1 1.624345 0.319039 50 Q2 -0.611756 0.319039 50 Q3...

Как найти вероятность по z-оценке: с примерами

Самый простой способ найти вероятность по az-показателю — просто найти вероятность, соответствующую z-показателю, в таблице z. В этом уроке объясняется, как использовать таблицу z для нахождения следующих вероятностей: Вероятность того, что значение ниже определенного z-показателя. Вероятность того, что значение превышает определенный...

Связь между средним и стандартным отклонением (с примером)

Среднее значение представляет собой среднее значение в наборе данных. Он рассчитывается следующим образом: Выборочное среднее = Σx i /n Золото: Σ: Символ, означающий «сумма». x i : i -е наблюдение в наборе данных. n: общее количество наблюдений в наборе данных Стандартное...

Кластеризация k-средних в python: пошаговый пример

Один из наиболее распространенных алгоритмов кластеризации в машинном обучении известен как кластеризация k-средних . Кластеризация K-средних — это метод, при котором мы помещаем каждое наблюдение из набора данных в один из K- кластеров. Конечная цель состоит в том, чтобы иметь K...

Pandas: как использовать like в запросе()

Вы можете использовать следующие методы для использования LIKE (аналогично SQL) в функции pandas query() для поиска строк, содержащих определенный шаблон: Метод 1: найти строки, содержащие шаблон df. query (' my_column.str.contains("pattern1") ') Метод 2: найти строки, содержащие один из нескольких шаблонов df....

Как построить график распределения значений столбцов в pandas

Вы можете использовать следующие методы для построения графика распределения значений столбцов в DataFrame pandas: Способ 1: построить график распределения значений в столбце df[' my_column ']. plot (kind=' kde ') Способ 2. Постройте график распределения значений в одном столбце, сгруппированных по другому...

Как преобразовать массив чисел с плавающей запятой numpy в целые числа

Вы можете использовать следующие методы для преобразования массива чисел с плавающей запятой NumPy в массив целых чисел: Метод 1. Преобразование чисел с плавающей запятой в целые числа (округление вниз) rounded_down_integer_array = float_array. astype (int) Способ 2. Преобразование чисел с плавающей запятой...