Souvent, vous devrez peut-être convertir des nombres au format de date dans R. Le moyen le plus simple de le faire est d’utiliser le package lubridate , qui possède plusieurs fonctions utiles pour gérer les dates dans R. Ce didacticiel fournit...
Pour calculer une moyenne pondérée dans R, vous pouvez utiliser la fonction intégréeweighted.mean() , qui utilise la syntaxe suivante : pondéré.moyenne (x, w) où: x : un vecteur de valeurs de données brutes w : Un vecteur de poids Ce tutoriel montre plusieurs exemples d’utilisation...
Le test de causalité de Granger est utilisé pour déterminer si une série chronologique est utile ou non pour en prévoir une autre. Ce test utilise les hypothèses nulles et alternatives suivantes : Hypothèse nulle (H 0 ) : la série temporelle x...
Le test Q de Cochran est un test statistique utilisé pour déterminer si la proportion de « réussites » est égale dans trois groupes ou plus dans lesquels les mêmes individus apparaissent dans chaque groupe. Par exemple, nous pouvons utiliser le...
En statistiques, un problème de troisième variable survient lorsqu’une corrélation observée entre deux variables peut en réalité être expliquée par une troisième variable qui n’a pas été prise en compte. Lorsque cette troisième variable n’est pas prise en compte, la corrélation...
La fonction cbind dans R, abréviation de column-bind , peut être utilisée pour combiner des vecteurs, des matrices et des trames de données par colonne. Les exemples suivants montrent comment utiliser cette fonction dans la pratique. Exemple 1 : Clier des vecteurs...
Nous pouvons utiliser la syntaxe suivante pour convertir un vecteur de caractères en vecteur numérique dans R : numeric_vector <- as.numeric(character_vector) Ce tutoriel fournit plusieurs exemples d’utilisation pratique de cette fonction. Exemple 1 : Convertir un vecteur de caractère en numérique Le code suivant...
Il existe trois manières courantes d’ajouter une nouvelle colonne à un bloc de données dans R : 1. Utilisez l’opérateur $ df$new <- c(3, 3, 6, 7, 8, 12) 2. Utilisez des supports df['new'] <- c(3, 3, 6, 7, 8, 12) 3....
Vous pouvez utiliser l’argument size pour ajuster l’épaisseur d’une ligne dans ggplot2 : ggplot(df, aes(x = x, y = y)) + geom_line(size = 1.5) La taille est égale à 1 par défaut, mais vous pouvez spécifier n’importe quelle valeur décimale dont...
Une distribution de fréquence décrit la fréquence à laquelle différentes valeurs apparaissent dans un ensemble de données. Par exemple, supposons que nous rassemblions un échantillon aléatoire simple de 400 ménages dans une ville et que nous enregistrions le nombre d’animaux de...