Une introduction rapide à l’apprentissage supervisé et non supervisé



Le domaine de l’apprentissage automatique contient un ensemble massif d’algorithmes qui peuvent être utilisés pour comprendre les données. Ces algorithmes peuvent être classés dans l’une des deux catégories suivantes :

1. Algorithmes d’apprentissage supervisé : impliquent la construction d’un modèle pour estimer ou prédire un résultat basé sur une ou plusieurs entrées.

2. Algorithmes d’apprentissage non supervisés : impliquent de trouver une structure et des relations à partir des entrées. Il n’y a pas de sortie « supervision ».

Ce didacticiel explique la différence entre ces deux types d’algorithmes ainsi que plusieurs exemples de chacun.

Algorithmes d’apprentissage supervisé

Un algorithme d’apprentissage supervisé peut être utilisé lorsque nous avons une ou plusieurs variables explicatives (X 1 , X 2 , X 3 , …, X p ) et une variable de réponse (Y) et que nous aimerions trouver une fonction qui décrit la relation entre les variables explicatives et la variable réponse :

Y = f (X) + ε

f représente les informations systématiques que X fournit sur Y et où ε est un terme d’erreur aléatoire indépendant de X avec une moyenne de zéro.

Algorithmes d’apprentissage supervisé

Il existe deux principaux types d’algorithmes d’apprentissage supervisé :

1. Régression : la variable de sortie est continue (par exemple poids, taille, temps, etc.)

2. Classification : La variable de sortie est catégorielle (par exemple homme ou femme, réussite ou échec, bénin ou malin, etc.)

Il y a deux raisons principales pour lesquelles nous utilisons des algorithmes d’apprentissage supervisé :

1. Prédiction : Nous utilisons souvent un ensemble de variables explicatives pour prédire la valeur d’une variable de réponse (par exemple, en utilisant la superficie en pieds carrés et le nombre de chambres pour prédire le prix d’une maison ).

2. Inférence : Nous pourrions être intéressés à comprendre la manière dont une variable de réponse est affectée lorsque la valeur des variables explicatives change (par exemple, de combien le prix de l’immobilier augmente-t-il, en moyenne, lorsque le nombre de chambres augmente d’une ?)

Selon que notre objectif est l’inférence ou la prédiction (ou un mélange des deux), nous pouvons utiliser différentes méthodes pour estimer la fonction f . Par exemple, les modèles linéaires offrent une interprétation plus facile, mais les modèles non linéaires difficiles à interpréter peuvent offrir des prédictions plus précises.

Voici une liste des algorithmes d’apprentissage supervisé les plus couramment utilisés :

  • Régression linéaire
  • Régression logistique
  • Analyse discriminante linéaire
  • Analyse discriminante quadratique
  • Arbres de décision
  • Bayes naïfs
  • Machines vectorielles de support
  • Les réseaux de neurones

Algorithmes d’apprentissage non supervisés

Un algorithme d’apprentissage non supervisé peut être utilisé lorsque nous disposons d’une liste de variables (X 1 , X 2 , X 3 , …, X p ) et que nous souhaitons simplement trouver une structure ou des modèles sous-jacents dans les données.

Algorithmes d'apprentissage non supervisé dans l'apprentissage automatique

Il existe deux principaux types d’algorithmes d’apprentissage non supervisé :

1. Clustering : à l’aide de ces types d’algorithmes, nous essayons de trouver des « groupes » d’ observations dans un ensemble de données qui sont similaires les unes aux autres. Ceci est souvent utilisé dans le commerce de détail lorsqu’une entreprise souhaite identifier des groupes de clients ayant des habitudes d’achat similaires afin de pouvoir créer des stratégies marketing spécifiques ciblant certains groupes de clients.

2. Association : En utilisant ces types d’algorithmes, nous essayons de trouver des « règles » qui peuvent être utilisées pour établir des associations. Par exemple, les détaillants peuvent développer un algorithme d’association qui indique que « si un client achète le produit X, il est très probable qu’il achète également le produit Y ».

Voici une liste des algorithmes d’apprentissage non supervisé les plus couramment utilisés :

  • Analyse des composants principaux
  • K-means clustering
  • Regroupement des K-médoïdes
  • Classification hiérarchique
  • Algorithme a priori

Résumé : Apprentissage supervisé ou non supervisé

Le tableau suivant résume les différences entre les algorithmes d’apprentissage supervisé et non supervisé :

Apprentissage supervisé ou non supervisé

Et le diagramme suivant résume les types d’algorithmes d’apprentissage automatique :

Algorithmes d’apprentissage automatique supervisés ou non supervisés

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *