Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment tracer la distribution des valeurs de colonne dans R



Vous pouvez utiliser les méthodes suivantes pour tracer une distribution de valeurs de colonne dans R :

Méthode 1 : tracer la distribution des valeurs à l’aide du tracé de densité

plot(density(df$my_column))

Méthode 2 : tracer la distribution des valeurs à l’aide d’un histogramme

hist(df$my_column)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant

#create data frame
df = data.frame(team=rep(c('A', 'B'), each=10),
                points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8,
                         7, 8, 9, 12, 12, 12, 14, 15, 17))

#view data frame
df

   team points
1     A      3
2     A      3
3     A      4
4     A      5
5     A      4
6     A      7
7     A      7
8     A      7
9     A     10
10    A     11
11    B      8
12    B      7
13    B      8
14    B      9
15    B     12
16    B     12
17    B     12
18    B     14
19    B     15
20    B     17

Exemple 1 : tracer la distribution des valeurs à l’aide du tracé de densité

Le code suivant montre comment tracer la distribution des valeurs dans la colonne des points à l’aide d’un tracé de densité :

#plot distribution of values in points column
plot(density(df$points)) 

Cette syntaxe produit une courbe lisse qui résume la distribution des valeurs d’une variable.

Notez que nous pouvons également modifier le titre, les étiquettes des axes et la couleur de la ligne dans le tracé de densité si nous le souhaitons :

#plot distribution of values in points column
plot(density(df$points), col='red', main='Density Plot of Points', xlab='Points')

tracer la distribution des valeurs de colonne dans R à l'aide du tracé de densité

Exemple 2 : tracer la distribution des valeurs à l’aide d’un histogramme

Le code suivant montre comment tracer la distribution des valeurs dans la colonne de points à l’aide d’un histogramme :

#plot distribution of values in points column using histogram
hist(df$points)

Un histogramme utilise des barres pour représenter les fréquences des valeurs dans la colonne de points , par opposition à une ligne lisse qui résume la forme de la distribution.

Notez que nous pouvons également modifier le titre, les étiquettes des axes, la couleur et le nombre de sauts utilisés dans l’histogramme :

#plot distribution of values in points column using histogram
hist(df$points, main='Histogram of Points', xlab='Points', col='steelblue', breaks=12)

tracer la distribution des valeurs de colonne dans R à l'aide de l'histogramme

Remarque : Plus la valeur que vous choisissez pour l’argument breaks est grande, plus il y aura de barres dans l’histogramme.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment ajouter une ligne verticale à l’histogramme dans R
Comment créer des tracés de densité de noyau dans R
Comment superposer des tracés de densité dans ggplot2

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *