Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment créer une carte thermique de corrélation dans R (avec exemple)



Vous pouvez utiliser la syntaxe de base suivante pour créer une carte thermique de corrélation dans R :

#calculate correlation between each pairwise combination of variables
cor_df <- round(cor(df), 2)

#melt the data frame
melted_cormat <- melt(cor_df)

#create correlation heatmap
ggplot(data = melted_cormat, aes(x=Var1, y=Var2, fill=value)) + 
  geom_tile() +
  geom_text(aes(Var2, Var1, label = value), size = 5) +
  scale_fill_gradient2(low = "blue", high = "red",
                       limit = c(-1,1), name="Correlation") +
  theme(axis.title.x = element_blank(),
        axis.title.y = element_blank(),
        panel.background = element_blank())

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : créer une carte thermique de corrélation dans R

Supposons que nous ayons le bloc de données suivant dans R qui montre diverses statistiques pour huit joueurs de basket différents :

#create data frame
df <- data.frame(points=c(22, 25, 30, 16, 14, 18, 29, 22),
                 assists=c(4, 4, 5, 7, 8, 6, 7, 12),
                 rebounds=c(10, 7, 7, 6, 8, 5, 4, 3),
                 blocks=c(12, 4, 4, 6, 5, 3, 8, 5))

#view data frame
df

  points assists rebounds blocks
1     22       4       10     12
2     25       4        7      4
3     30       5        7      4
4     16       7        6      6
5     14       8        8      5
6     18       6        5      3
7     29       7        4      8
8     22      12        3      5

Supposons que nous souhaitions créer une carte thermique de corrélation pour visualiser le coefficient de corrélation entre chaque combinaison par paire de variables dans le bloc de données.

Avant de créer la carte thermique de corrélation, nous devons d’abord calculer le coefficient de corrélation entre chaque variable à l’aide de cor() puis transformer les résultats dans un format utilisable à l’aide de la fonction melt() du package reshape2 :

library(reshape2)

#calculate correlation coefficients, rounded to 2 decimal places
cor_df <- round(cor(df), 2)

#melt the data frame
melted_cor <- melt(cor_df)

#view head of melted data frame
head(melted_cor)

      Var1    Var2 value
1   points  points  1.00
2  assists  points -0.27
3 rebounds  points -0.16
4   blocks  points  0.10
5   points assists -0.27
6  assists assists  1.00

Ensuite, nous pouvons utiliser la fonction geom_tile() du package ggplot2 pour créer une carte thermique de corrélation :

library(ggplot2)

#create correlation heatmap
ggplot(data = melted_cor, aes(x=Var1, y=Var2, fill=value)) + 
  geom_tile() +
  geom_text(aes(Var2, Var1, label = value), size = 5) +
  scale_fill_gradient2(low = "blue", high = "red",
                       limit = c(-1,1), name="Correlation") +
  theme(axis.title.x = element_blank(),
        axis.title.y = element_blank(),
        panel.background = element_blank())

carte thermique de corrélation dans R

Le résultat est une carte thermique de corrélation qui nous permet de visualiser le coefficient de corrélation entre chaque combinaison de variables par paire.

Dans cette carte thermique particulière, les coefficients de corrélation prennent les couleurs suivantes :

  • Bleu s’ils sont proches de -1
  • Blanc s’ils sont proches de 0
  • Rouge s’ils sont proches de 1

N’hésitez pas à utiliser les couleurs de votre choix pour les arguments bas et haut dans la fonction scale_fill_gradient2() .

Par exemple, vous pouvez utiliser « rouge » pour la valeur faible et « vert » pour la valeur élevée :

library(ggplot2)

#create correlation heatmap
ggplot(data = melted_cor, aes(x=Var1, y=Var2, fill=value)) + 
  geom_tile() +
  geom_text(aes(Var2, Var1, label = value), size = 5) +
  scale_fill_gradient2(low = "red", high = "green",
                       limit = c(-1,1), name="Correlation") +
  theme(axis.title.x = element_blank(),
        axis.title.y = element_blank(),
        panel.background = element_blank())

carte thermique de corrélation dans R avec des couleurs personnalisées

Remarque : Vous pouvez également spécifier des codes de couleur hexadécimaux à utiliser si vous souhaitez encore plus de contrôle sur les couleurs exactes dans la carte thermique de corrélation.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans ggplot2 :

Comment faire pivoter les étiquettes des axes dans ggplot2
Comment définir des sauts d’axe dans ggplot2
Comment définir les limites de l’axe dans ggplot2
Comment changer les étiquettes de légende dans ggplot2

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *