Косинусное сходство — это мера сходства между двумя векторами пространства внутреннего продукта. Для двух векторов A и B косинусное подобие рассчитывается следующим образом: Косинусное подобие = ΣA я B я / (√ΣA я 2 √ΣB я 2 ) В этом руководстве...
Евклидово расстояние между двумя векторами A и B рассчитывается следующим образом: Евклидово расстояние = √ Σ(A i -B i ) 2 Чтобы вычислить евклидово расстояние между двумя векторами в Python, мы можем использовать функцию numpy.linalg.norm : #import functions import numpy as...
Стандартизация набора данных означает масштабирование всех значений в наборе данных таким образом, чтобы среднее значение было равно 0, а стандартное отклонение — 1. Самый распространенный способ сделать это — использовать стандартизацию z-показателя, которая масштабирует значения по следующей формуле: (x i –...
Существует два основных способа создания пустого фрейма данных в R: Способ 1: Матрица с именами столбцов #create data frame with 0 rows and 3 columns df <- data.frame(matrix(ncol = 3, nrow = 0)) #provide column names colnames(df) <- c(' var1 ',...
Вы можете быстро добавить одну или несколько строк во фрейм данных в R, используя один из следующих методов: Способ 1: используйте rbind() для добавления кадров данных. rbind(df1, df2) Способ 2: используйте nrow() для добавления строки. df[nrow(df) + 1,] = c(value1, value2,...
Язык программирования R предоставляет две полезные функции для отображения и удаления объектов в рабочей области R: ls(): выводит список всех объектов в текущей рабочей области. rm(): удаляет один или несколько объектов из текущей рабочей области. В этом руководстве объясняется, как использовать...
Есть два способа быстро извлечь год из даты в R: Способ 1: используйте формат() df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ") Способ 2. Используйте пакет смазки. library (lubridate) df$year <- year( mdy (df$date)) В этом руководстве показан пример...
Функция ВПР в Excel позволяет найти значение в таблице, сопоставляя его со столбцом. Например, в следующей таблице Excel мы можем найти название команды игрока, используя ВПР, чтобы сопоставить имя игрока и вернуть команду игрока: Мы можем воспроизвести эту функцию, используя базу...
Вы можете легко удалить знаки доллара и запятые из столбцов фрейма данных в R с помощью функции gsub() . В этом уроке показаны три примера практического использования этой функции. Удалить знаки доллара в R Следующий код показывает, как удалить знаки доллара...
Критерий Колмогорова-Смирнова используется для проверки того, происходит ли выборка из определенного распределения. Чтобы выполнить одно- или двухвыборочный тест Колмогорова-Смирнова в R, мы можем использовать функцию ks.test() . В этом руководстве показан пример использования этой функции на практике. Пример 1: Тестовая выборка...