L’autocorrélation mesure le degré de similarité entre une série temporelle et une version décalée d’elle-même sur des intervalles de temps successifs. On l’appelle aussi parfois « corrélation en série » ou « corrélation décalée », car elle mesure la relation entre...
La similarité cosinus est une mesure de la similarité entre deux vecteurs d’un espace produit interne. Pour deux vecteurs, A et B, la similarité cosinus est calculée comme suit : Similarité cosinus = ΣA i B i / (√ΣA i 2 √ΣB...
La distance euclidienne entre deux vecteurs A et B est calculée comme suit : Distance euclidienne = √ Σ(A i -B i ) 2 Pour calculer la distance euclidienne entre deux vecteurs en Python, on peut utiliser la fonction numpy.linalg.norm : #import...
Standardiser un ensemble de données signifie mettre à l’échelle toutes les valeurs de l’ensemble de données de telle sorte que la valeur moyenne soit 0 et l’écart type soit 1. La manière la plus courante de procéder consiste à utiliser la...
Il existe deux manières de base de créer un bloc de données vide dans R : Méthode 1 : Matrice avec noms de colonnes #create data frame with 0 rows and 3 columns df <- data.frame(matrix(ncol = 3, nrow = 0)) #provide column...
Vous pouvez ajouter rapidement une ou plusieurs lignes à un bloc de données dans R en utilisant l’une des méthodes suivantes : Méthode 1 : utilisez rbind() pour ajouter des trames de données. rbind(df1, df2) Méthode 2 : utilisez nrow() pour ajouter une ligne....
Le langage de programmation R offre deux fonctions utiles pour afficher et supprimer des objets dans un espace de travail R : ls() : répertorie tous les objets de l’espace de travail actuel rm() : supprime un ou plusieurs objets de l’espace de travail...
Il existe deux façons d’extraire rapidement l’année d’une date dans R : Méthode 1 : utiliser format() df$year <- format(as.Date(df$date, format="%d/%m/%Y"),"%Y") Méthode 2 : utilisez le package de lubrification library(lubridate) df$year <- year(mdy(df$date)) Ce didacticiel montre un exemple de la façon d’utiliser chacune de...
La fonction RECHERCHEV dans Excel vous permet de rechercher une valeur dans un tableau en la faisant correspondre sur une colonne. Par exemple, dans la feuille de calcul Excel suivante, nous pouvons rechercher le nom de l’équipe d’un joueur en utilisant...
Vous pouvez facilement supprimer les signes dollar et les virgules des colonnes du bloc de données dans R en utilisant la fonction gsub() . Ce tutoriel montre trois exemples d’utilisation pratique de cette fonction. Supprimer les signes dollar dans R Le...