Souvent, vous souhaiterez peut-être modifier l’échelle utilisée sur un axe dans les tracés R. Ce didacticiel explique comment modifier les échelles des axes sur les tracés en base R et ggplot2. Exemple 1 : modifier les échelles des axes dans la base...
Un boxplot (parfois appelé diagramme en boîte et moustaches) est un tracé qui montre le résumé à cinq chiffres d’un ensemble de données, qui comprend les valeurs suivantes : Le minimum Premier quartile Médian Troisième quartile Maximum En utilisant ces cinq valeurs,...
Un boxplot (parfois appelé diagramme en boîte et moustaches) est un tracé qui montre le résumé à cinq chiffres d’un ensemble de données, qui comprend les valeurs suivantes : Le minimum Premier quartile Médian Troisième quartile Maximum Pour créer un boxplot horizontal...
La distance de Manhattan entre deux vecteurs, A et B , est calculée comme suit : Σ|UNE je – B je | où i est le i ème élément de chaque vecteur. Cette distance est utilisée pour mesurer la dissemblance entre deux...
Vous pouvez utiliser la syntaxe suivante pour créer des boxplots par groupe dans Matplotlib : import matplotlib as plt import seaborn as sns sns.boxplot(x='group', y='values', data=df) Les exemples suivants montrent comment utiliser cette syntaxe pour créer des boîtes à moustaches par groupe...
Vous pouvez utiliser la syntaxe suivante pour tracer une série temporelle dans Matplotlib : import matplotlib.pyplot as plt plt.plot(df.x, df.y) Cela suppose que la variable x appartient à la classe datetime.datetime() . Les exemples suivants montrent comment utiliser cette syntaxe pour tracer...
Un résumé à cinq chiffres est un moyen de résumer un ensemble de données en utilisant les cinq valeurs suivantes : Le minimum Le premier quartile La médiane Le troisième quartile Le maximum En connaissant simplement ces cinq valeurs, nous pouvons en...
L’ intervalle interquartile , souvent appelé IQR, est un moyen de mesurer la répartition des 50 % centraux d’un ensemble de données. Il est calculé comme la différence entre le premier quartile (Q1) et le troisième quartile (Q3) d’un ensemble de données....
La distribution géométrique décrit la probabilité de connaître un certain nombre d’échecs avant de connaître le premier succès dans une série d’essais présentant les caractéristiques suivantes : Il n’y a que deux résultats possibles : le succès ou l’échec. La probabilité de...
Un coefficient de variation , souvent abrégé en CV , est un moyen de mesurer l’étalement des valeurs dans un ensemble de données par rapport à la moyenne. Il est calculé comme suit : CV = σ / μ où: σ : l’écart type...