Рубрика: Гид

Excel: как фильтровать данные в сводной таблице, используя «больше чем»

Часто вам может потребоваться отфильтровать значения в сводной таблице Excel с помощью фильтра «Больше чем». К счастью, это легко сделать с помощью раскрывающегося меню «Фильтры значений» в столбце « Метки строк» сводной таблицы. В следующем примере показано, как именно это сделать....

Как изменить размер легенды в базовом графике r (с примерами)

Самый простой способ изменить размер легенды на базовом графике R — использовать аргумент cex : legend(' topright ', legend=c(' A ', ' B '), col=1:2, pch= 16 , cex= 1 ) Значение cex по умолчанию — 1. Чем больше значение, которое...

Pandas: как проверить тип всех столбцов в dataframe

Вы можете использовать следующие методы для проверки типа данных ( dtype ) столбцов в DataFrame pandas: Способ 1. Проверьте тип столбца df. column_name . dtype Способ 2. Проверьте тип всех столбцов. df. dtypes Способ 3. Проверьте, какие столбцы имеют определенный тип. df. dtypes...

Как преобразовать словарь в pandas dataframe (2 примера)

Вы можете использовать любой из следующих методов для преобразования словаря Python в DataFrame pandas: Способ 1: используйте dict.items() df = pd. DataFrame (list(some_dict. items ()), columns = [' col1 ', ' col2 ']) Способ 2: используйте from_dict() df = pd. DataFrame...

Как использовать экспоненциальное распределение в python

Экспоненциальное распределение — это распределение вероятностей, используемое для моделирования времени, в течение которого нам придется ждать, пока не произойдет определенное событие. Если случайная величина X имеет экспоненциальное распределение, то кумулятивную функцию распределения X можно записать: F (x; λ) = 1 –...

Введение в сходство джаро – винклера (определение и пример)

В статистике сходство Джаро-Винклера — это способ измерения сходства между двумя строками. Сходство Джаро (sim j ) между двумя строками определяется как: sim j = 1/3 * ( м /|с 1 | + м/|с 2 | + (мт)/м ) Золото: m...

Как интерпретировать отчет о классификации в sklearn (с примером)

Когда мы используем модели классификации в машинном обучении, мы используем три общих показателя для оценки качества модели: 1. Точность : процент правильных положительных прогнозов по сравнению с общим количеством положительных прогнозов. 2. Напомним : процент правильных положительных прогнозов по сравнению с...

Как создать набор поездов и тестов из pandas dataframe

При подгонке моделей машинного обучения к наборам данных мы часто делим набор данных на два набора: 1. Обучающий набор: используется для обучения модели (70-80% исходного набора данных). 2. Тестовый набор: используется для получения несмещенной оценки эффективности модели (20–30 % исходного набора данных)....

Pandas: как создать новый dataframe из существующего dataframe

Существует три распространенных способа создания нового DataFrame pandas из существующего DataFrame: Способ 1. Создайте новый DataFrame, используя несколько столбцов из старого DataFrame. new_df = old_df[[' col1 ', ' col2 ']]. copy () Способ 2. Создайте новый DataFrame, используя столбец из старого...

Pandas: как заменить значения nan в сводной таблице нулями

Вы можете использовать аргумент fill_value в pandas для замены значений NaN в сводной таблице нулями. Для этого вы можете использовать следующий базовый синтаксис: p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 ) В следующем примере...