Рубрика: Гид

Статистик и специалист по данным: в чем разница?

Статистики и ученые, работающие с данными , много работают с данными, но между этими двумя профессиями есть несколько ключевых различий: Отличие №1 (типы данных). Ученые, работающие с данными, как правило, тратят больше времени на сбор и очистку несовершенных данных, в то...

Excel: используйте индекс и поискпоз для возврата нескольких значений по вертикали

Вы можете использовать следующую базовую формулу с ИНДЕКС и ПОИСКПОЗ для возврата нескольких значений по вертикали в Excel: =IFERROR(INDEX( $B$2:$B$11 ,SMALL(IF( $D$2 = $A$2:$A$11 ,ROW( $A$2:$A$11 )-ROW( $A$2 )+1), ROW( 1:1 )))),"") Эта конкретная формула возвращает все значения в диапазоне B2:B11...

Google таблицы: используйте впр с несколькими критериями

Часто вам может потребоваться использовать VLOOKUP в Google Sheets для поиска значений на основе нескольких критериев. Например, предположим, что у нас есть следующие два набора данных, и вы хотите использовать ВПР в правом наборе данных, чтобы вернуть значение в столбце «...

Google таблицы: используйте впр, чтобы получить все совпадения

По умолчанию функция ВПР в Google Таблицах ищет значение в диапазоне и возвращает соответствующее значение только для первого совпадения . Однако вы можете использовать следующий синтаксис для поиска значения в диапазоне и возврата совпадающих значений для всех совпадений : =FILTER( C2:C11...

Как изменить метки оси x в ggplot2

Вы можете использовать функцию Scale_x_discrete() для изменения меток оси X на графике в ggplot2: p + scale_x_discrete(labels=c(' label1 ', ' label2 ', ' label3 ', ...)) В следующем примере показано, как использовать этот синтаксис на практике. Пример: изменить метки оси X...

Pandas: как пропускать строки при чтении файла csv

Вы можете использовать следующие методы для пропуска строк при чтении CSV-файла в DataFrame pandas: Способ 1: пропустить определенную строку #import DataFrame and skip 2nd row df = pd. read_csv ('my_data.csv', skiprows=[ 2 ]) Метод 2: игнорирование нескольких определенных строк #import DataFrame...

Как получить индекс максимального значения в массиве numpy

Вы можете использовать следующие методы, чтобы получить индекс максимального значения в массиве NumPy: Способ 1: получить индекс максимального значения в одномерном массиве x. argmax () Способ 2: получить индекс максимального значения в каждой строке многомерного массива. x. argmax (axis= 1 )...

Как заменить na на mean в dplyr

Для замены значений NA средним значением с помощью функций из пакетов dplyr и Tidyr в R можно использовать следующие методы: Способ 1: заменить значения NA средним значением в столбце df %>% mutate(across(col1, ~replace_na(., mean(., na. rm = TRUE )))) Способ 2....

Как заменить na медианой в r

Для замены значений NA на медиану с помощью функций из пакетов dplyr и Tidyr в R можно использовать следующие методы: Способ 1: заменить значения NA медианой в столбце df %>% mutate(across(col1, ~replace_na(., median(., na. rm = TRUE )))) Способ 2: заменить...

Excel: как использовать впр из другой книги

Вы можете использовать следующий базовый синтаксис для выполнения ВПР из другой книги в Excel: =VLOOKUP( A2 ,'[data2.xlsx]Sheet1'!$A$1:$B$11,2,0) Эта конкретная формула будет искать значение в ячейке A2 текущей книги в диапазоне A1:B11 второй книги с именем data2.xlsx и возвращать соответствующее значение во...