Apprentissage supervisé et non supervisé : quelles différences ?

Temps de lecture : 5 minutes

Publié le 29 mai 2020

L’intelligence artificielle est partout ! Mais êtes-vous sûrs de bien maîtriser tous les concepts qu’elle recouvre ? On s’attaque dans cet article à des termes que vous avez sûrement déjà lus ou entendus, sans forcément savoir ce qui les distingue : l’apprentissage supervisé et l’apprentissage non supervisé. Définition croisée.

Quand on parle d’apprentissage supervisé ou d’apprentissage non supervisé, on parle toujours de machine learning et donc d’intelligence artificielle. Il s’agit de deux sous-catégories qui permettent de résoudre des problèmes. Mais alors, comment fonctionnent-elles ? Qui supervise les algorithmes ? Comment les distinguer et à quels usages répondent-elles ?

Qu’est-ce que le machine learning déjà ?

Nous avons déjà abordé le sujet du machine learning dans un autre article, pour le distinguer du deep learning. Pour résumer, le machine learning est un modèle d’intelligence artificielle qui apprend seul grâce à l’analyse d’un jeu de données. Pour cela, il utilise des procédés automatiques issus des statistiques et des probabilités. Son objectif ? Aider les humains à exploiter des volumes de données inenvisageables et leur faire gagner du temps dans des activités à faible valeur ajoutée. Par exemple : examiner des images médicales, segmenter une base de clients en marketing ou évaluer la probabilité qu’une machine tombe en panne. Parmi les techniques qui permettent aux experts de concevoir des machines apprenantes, on distingue deux types d’apprentissage : l’apprentissage supervisé et l’apprentissage non supervisé. Explications.

Livre Blanc

Création d’une ville hyperconnectée

Quelle sont les bonnes pratiques et les défis liés de la création d’une ville hyperconnectée ? Cet Ebook interactif et collaboratif vous dévoile son analyse sur les villes hyperconnectées.

Télécharger le livre blanc

En quoi consiste l’apprentissage supervisé ?

Qu’il s’agisse des types d’apprentissage supervisé ou non supervisé, tout part d’un jeu de données très important. Et quand on dit « très important », cela peut signifier jusqu’à plusieurs millions d”images pour la base ImageNet. C’est à partir de cette base que l’algorithme peut apprendre. Mais dans le cadre de l’apprentissage supervisé, la machine connaît déjà les réponses qu’on attend d’elle. Elle travaille à partir de données étiquetées. Prenons l’exemple d’une application destinée à reconnaître les spams de manière automatique. Pour l’entraîner, on lui présente des emails étiquetés comme « désirables » ou « spams ». Par des techniques issues des statistiques et des probabilités, l’algorithme comprend alors quelles sont les caractéristiques qui permettent de classer ces emails dans chacune des catégories. Ainsi, au fur et à mesure qu’on lui présentera des nouveaux emails, il pourra les identifier, en donnant un score de probabilité. Par exemple : « cet email a 95 % de chances d’être un spam. » Et ses premières réponses seront corrigées à la main, pour qu’il s’améliore au fur et à mesure.

Cette méthode permet de réaliser deux types de tâches :

Des tâches de classification :

Ces tâches consistent à attribuer une classe à des objets. Par exemple, dans le milieu bancaire, on peut identifier si une transaction est frauduleuse ou non frauduleuse de manière automatique. On parle de détection d’anomalie. Dans l’industrie, on peut déterminer si oui ou non une machine est susceptible de tomber en panne. On associe une réponse prédéfinie (oui ou non, jaune, rouge, vert ou bleu) à un objet, avant de demander à l’algorithme de réaliser cette classification.

Des tâches de régression :

Ici, on n’attribue pas une classe mais une valeur mathématique : un pourcentage ou une valeur absolue. Par exemple, une probabilité pour une machine de tomber en panne (15 %, 20 %, etc.) ou le prix de vente idéal d’un appartement en fonction de critères comme la surface, le quartier, etc.

Livre Blanc

Transformation numérique : la défense et le renseignement

Les opérations militaires et de renseignement adoptent facilement la transformation numérique pour améliorer leur préparation, moderniser leur environnement de travail et renforcer la collaboration.

Télécharger le livre blanc

Et l’apprentissage non supervisé ?

La différence lorsqu’on parle du type d’apprentissage non-supervisé, c’est que les réponses que l’on cherche à prédire ne sont pas disponibles dans les jeux de données. Ici, l’algorithme utilise un jeu de données non étiquetées. On demande alors à la machine de créer ses propres réponses. Elle propose ainsi des réponses à partir d’analyses et de groupement de données. Pour y voir plus clair, voici des exemples de tâches réalisables grâce à cette méthode.

Des tâches de clustering :

Ici, on demande à la machine de grouper des objets dans des ensembles de données les plus homogènes possible. Cette technique peut sembler proche de celle de la classification dans l’apprentissage supervisé, mais à la différence de cette dernière, les classes ne sont pas pré-remplies par un humain, c’est la machine qui “invente” ses propres classes, à un niveau de finesse pas toujours évident pour un humain. Une technique très utile dans le marketing pour faire de la segmentation client notamment.

Un exemple ? Imaginons qu’on veuille segmenter des automobilistes, pour construire des offres de mobilité personnalisées pour les clients, grâce à des algorithmes d’apprentissage. Le clustering rapproche des individus aux habitudes très similaires dans un groupe et éloigne des individus très différents. On obtient alors des groupes homogènes aux caractéristiques propres. Par exemple, les individus qui utilisent leur voiture en semaine et passent du temps dans les bouchons, ceux qui ont plutôt tendance à conduire le week-end pour des trajets courts, etc. Cela permet au marketing de leur proposer des offres week-end, semaine, etc. Le clustering permet d’atteindre des niveaux de précision impossibles pour un humain et d’identifier des schémas qu’il n’aurait pas pu repérer.

Des tâches de filtrage collaboratif :

Ici l’objectif est toujours de personnaliser une expérience client. C’est une technique utilisée par de très nombreuses plateformes, telles que Netflix, Spotify, etc. Leurs algorithmes étudient ce que vous avez regardé, aimé, mais aussi ce que des profils similaires au vôtre ont apprécié, pour vous faire des recommandations automatiques. Le modèle s’appuie sur des facteurs implicites inconscients (ce que l’utilisateur a fait), plutôt que des facteurs explicites (des critères remplis par l’utilisateur). Ce genre d’outils est très utilisé dans le e‑commerce, pour proposer des produits qui pourraient intéresser le client. Amazon en est devenu spécialiste.

Existe-t-il d’autres formes d’apprentissages ?

Il existe effectivement une troisième catégorie d’apprentissage : l’apprentissage par renforcement.

Ici, la machine peut se montrer encore plus créative, car elle peut élaborer ses propres stratégies et s’adapter dans le temps et dans son environnement pour réaliser des tâches données. Elle élabore des réponses complexes. L’algorithme devient un agent autonome, dont l’objectif est de réaliser une action au sein d’un environnement. S’il y parvient selon les critères établis par le développeur, il est récompensé. À lui d’élaborer la suite d’actions qui lui permet d’atteindre son objectif.

Un exemple pour nous éclairer ? Prenons un drone autonome qui doit livrer un colis d’un entrepôt de livraison vers une maison. Dans ce cas, l’acteur est le drone. Il peut réaliser différentes actions : avancer, reculer descendre, monter, accélérer, freiner… Chacune de ses actions modifie son état et l’état de l’environnement. Son but : se rendre sans encombre, en 30 minutes, à l’adresse indiquée et revenir. Il se lance alors, fais des premiers choix, joue sur différentes variables. Il évalue ses performances et comprend petit à petit ce qui fonctionne le mieux. Au bout de nombreuses tentatives, il finit par remplir sa mission de manière efficace.

C’est également cette méthode qui sera exploitée pour construire les algorithmes des voitures autonomes par exemple. Mais c’est aussi comme cela qu’on peut entraîner des machines capables de jouer à des jeux de stratégie.

En résumé, tout dépend, pour vous, de la base de données sur laquelle vous voulez faire travailler l’intelligence artificielle et du problème auquel vous cherchez des réponses. Si votre base est étiquetée et que vous savez clairement dans quelles catégories vous souhaitez classer vos données, alors l’apprentissage supervisé est pour vous. Si vos données ne sont pas étiquetées et que le faire représenterait un coût trop important, alors optez pour l’apprentissage non supervisé. L’apprentissage par renforcement vous permettra de développer des machines autonomes.

Questions Fréquentes

Qu’est ce que le machine learning ?

Le machine learning est un modèle d’intelligence artificielle qui apprend seul grâce à l’analyse d’un jeu de données. Son objectif ? Aider les humains à exploiter des volumes de données inenvisageables et leur faire gagner du temps dans des tâches chronophages.

Qu’est ce que l’apprentissage supervisé ?

L’apprentissage supervisé d’une machine apprenante provient d’un jeu de données très important. C’est à partir de cette base que l’algorithme commence à apprendre. Elle va donc réaliser des tâches et ses premières réponses seront corrigées à la main, pour qu’elle s’améliore au fur et à mesure.

Qu’est ce que l’apprentissage non supervisé ?

En comparaison d’un apprentissage supervisé, un apprentissage non supervisé va créer ses propres réponses car les réponses que l’on cherche à prédire ne sont pas disponibles dans les jeux de données. Elle propose ainsi des réponses à partir d’analyses et de groupement de données.

Le métavers au service de l’industrie

L’adaptive learning change les codes de l’apprentissage

Data Management: tout ce qu’il faut savoir