Категорія: Гід

Набір перевірки та набір тестів: у чому різниця?

Коли ми адаптуємо алгоритм машинного навчання до набору даних, ми зазвичай ділимо набір даних на три частини: 1. Навчальний набір : використовується для навчання моделі. 2. Набір перевірки : використовується для оптимізації параметрів моделі. 3. Тестовий набір : використовується для отримання...

Як використовувати фільтр «not in» у pandas (з прикладами)

Ви можете використати такий синтаксис, щоб виконати фільтр “NOT IN” у pandas DataFrame: df[ ~ df[' col_name ']. isin (values_list)] Зверніть увагу, що значення у Values_list можуть бути числовими або символьними значеннями. Наступні приклади показують, як використовувати цей синтаксис на практиці....

Як створити матрицю з векторів у r (з прикладами)

Щоб швидко створити матрицю з векторів у R, можна скористатися одним із двох методів: Спосіб 1. Використовуйте cbind(), щоб зв’язати вектори в матриці за стовпцями my_matrix <- cbind(vector1, vector2, vector3) Спосіб 2. Використовуйте rbind(), щоб зв’язати вектори в матриці за рядками...

Як перетворити дату на числову в r (з прикладами)

Існує два методи, які можна використовувати для перетворення значень дати в числові значення в R: Спосіб 1: Використовуйте as.numeric() as. numeric (my_date) Це поверне кількість секунд, що минуло між вашим об’єктом дати та 1/1/1970. Спосіб 2. Використовуйте функції пакета змащення library...

Як знайти та порахувати пропущені значення в r (з прикладами)

Ви можете використовувати такі методи, щоб знайти та підрахувати відсутні значення в R: Спосіб 1: Знайдіть розташування відсутніх значень which( is.na (df$column_name)) Спосіб 2: підрахуйте загальну кількість відсутніх значень sum( is.na (df$column_name)) Наступні приклади показують, як використовувати ці функції на практиці....

Як розрахувати підсумкову статистику по групах у r

Існує два основних способи обчислення підсумкової статистики групи в R: Спосіб 1. Використовуйте tapply() із Base R tapply(df$value_col, df$group_col, summary) Спосіб 2: Використовуйте group_by() з пакета dplyr library (dplyr) df %>% group_by (group_col) %>% summarize (min = min(value_col), q1 = quantile(value_col,...

Як розділити стовпець на кілька стовпців у r (з прикладами)

Ви можете використовувати один із двох методів, щоб розділити стовпець на кілька стовпців у R: Спосіб 1: Використовуйте str_split_fixed() library (stringr) df[c(' col1 ', ' col2 ')] <- str_split_fixed(df$original_column, ' sep ', 2) Спосіб 2: Використовуйте роздільний() library (dplyr) library (tidyr)...

Як порахувати різні значення за допомогою dplyr (з прикладами)

Ви можете використовувати будь-який із наведених нижче методів, щоб підрахувати кількість різних значень у кадрі даних R за допомогою функції n_distinct() dplyr : Спосіб 1: підрахуйте різні значення в стовпці n_distinct(df$column_name) Спосіб 2: Підрахуйте різні значення у всіх стовпцях sapply(df, function...

Як підрахувати кількість входжень у google таблицях

Ви можете використовувати функції =UNIQUE() і =COUNTIF() , щоб підрахувати кількість входжень різних значень у стовпці Google Таблиць. Наступний покроковий приклад показує, як це зробити. Крок 1: Введіть дані Давайте почнемо з введення назв деяких професійних баскетбольних команд у стовпець A:...

Запит google таблиць: як використовувати посилання на клітинку у формулі

Ви можете використовувати такий базовий синтаксис, щоб використовувати посилання на клітинку в запиті Google Таблиць: = QUERY ( $A$1:$B$11 , "Select B where A contains '" & D3 & "'" ) У цьому конкретному запиті ми просимо Google Таблиці вибрати значення...