Blog ENI : Toute la veille numérique !
🐠 -25€ dès 75€ 
+ 7 jours d'accès à la Bibliothèque Numérique ENI. Cliquez ici
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Machine Learning
  3. Évaluation et déploiement
Extrait - Machine Learning Implémentation en Python avec Scikit-learn
Extraits du livre
Machine Learning Implémentation en Python avec Scikit-learn
2 avis
Revenir à la page d'achat du livre

Évaluation et déploiement

Phase d’évaluation

1. Principe global

Si le Data Scientist doit évaluer les résultats de ses modèles dans la phase de modélisation, une évaluation métier doit ensuite être faite.

En effet, in fine, c’est le client, qui connaît le métier, qui va pouvoir décider si la qualité du modèle répond à ses besoins.

En effet, un très bon modèle avec 99 % d’accuracy est potentiellement excellent sur de la recherche de défauts, mais clairement insuffisant pour la détection de piétons dans une voiture autonome (qui écraserait 1 % des personnes croisées).

Cette phase d’évaluation a donc pour but d’évaluer si le modèle est suffisant pour le cas d’application et si tout le processus est correct. La suite du projet sera alors prévue selon l’acceptation ou non du modèle.

2. Évaluation métier des résultats

Le modèle proposé et ses résultats doivent être comparés aux besoins métiers exprimés en phase de Business Understanding ainsi qu’aux critères de succès déterminés.

Les résultats purs ne sont cependant pas suffisants. Il faut aussi vérifier que le modèle réponde dans toutes les situations réelles, via un dataset spécifique...

Phase de déploiement

La phase de déploiement est la dernière de la méthodologie CRISP-DM. De plus, contrairement aux autres phases, elle n’a lieu que lorsque le projet est considéré prêt à être fini en phase d’évaluation.

Il ne s’agit pourtant pas d’une phase technique. En réalité, la phase de déploiement sert à prévoir le projet qui suivra en fournissant des spécifications. Elle contient quatre étapes :

  • La planification du déploiement.

  • La planification du monitoring et de la maintenance.

  • La création du rapport final.

  • La finalisation de la documentation.

1. Planification du déploiement

Le déploiement est un projet à part entière. Il faut pour cela prévoir les principales étapes et surtout quel modèle déployer.

En effet, c’est rarement le modèle obtenu en phase de modélisation qui sera mis en production. Généralement, l’algorithme et les paramètres choisis sont utilisés pour entraîner une dizaine de modèles (avec des graines aléatoires différentes) puis chacun d’eux est évalué.

Il est donc nécessaire d’avoir une documentation complète de la procédure employée pour créer ces modèles.

En plus du modèle...

Déploiement et MLOps

1. Retours sur le DevOps

Dans un projet informatique classique, deux types de métiers sont généralement rencontrés :

  • Les "Dev" (développeurs) : ce sont ceux qui implémentent un système, en créant du code.

  • Les "Ops" (opérationnels) : ce sont ceux qui mettent en production les codes des développeurs et les maintiennent ensuite.

Jusque dans les années 2000, ces métiers étaient très différenciés et il existait de nombreuses frictions entre ceux-ci, surtout en cas de problème lors du déploiement. 

L’intégration continue (ou CI pour Continuous Integration) est l’approche permettant d’intégrer de nouvelles parties du code dans le code global.

Le déploiement continu (ou CD pour Continuous Delivery) est l’approche permettant de mettre rapidement en production le code créé, grâce à des pipelines automatisées (comprenant le packaging du code, l’installation des dépendances, les tests, le passage d’un environnement à l’autre).

Si l’ensemble des approches CI/CD date de quelques dizaines d’années, l’amélioration de celles-ci a permis l’émergence du DevOps moderne : les métiers Dev et Ops se sont rapprochés, jusqu’à se retrouver au sein des mêmes équipes.

Les outils CI/CD et la philosophie DevOps permettent maintenant à des équipes de créer un code, puis de le préparer pour la mise en production (dont les tests sur plusieurs environnements) et enfin le déploiement.

Chaque évolution ou correction peut ainsi être disponible pour les utilisateurs en quelques minutes et de nombreuses entreprises ont dorénavant des cycles de mise sur le marché très courts.

Pour plus d’informations sur l’approche DevOps, le livre "DevOps - Intégrez et déployez en continu" est disponible aux Éditions ENI.

2. Apparition du MLOps

Dans les projets de Machine Learning, la méthodologie CRISP-DM permet de créer un modèle. Ensuite, grâce aux apprentissages issus de la méthode, le modèle choisi pourra être entraîné et mis en production....