1. Livres & vidéos
  2. Réussir avec l’IA de Microsoft
  3. L'IA générative
Extrait - Réussir avec l’IA de Microsoft Stratégies et outils pour Copilot Studio, Microsoft Foundry et des IA non génératives
Extraits du livre
Réussir avec l’IA de Microsoft Stratégies et outils pour Copilot Studio, Microsoft Foundry et des IA non génératives Revenir à la page d'achat du livre

L'IA générative

Les modèles d’IA générative

L’intelligence artificielle générative a connu une accélération fulgurante grâce à l’émergence des LLM (Large Language Models) et plus récemment des SLM (Small Language Models). Ces deux types de modèles incarnent des approches complémentaires dans la conception de systèmes intelligents capables de comprendre, générer et interagir en langage naturel, tout en ayant des différences significatives.

1. Qu’est-ce qu’un LLM ?

Un LLM est un modèle de langage entraîné sur des milliards de paramètres et des corpus massifs de données textuelles. Il est conçu pour capturer des relations complexes entre les mots, les idées et les contextes. Les LLM comme GPT-4, Claude 3 ou Gemini 2.5 sont capables de générer des textes cohérents et créatifs, répondre à des questions complexes, traduire, résumer, coder, raisonner et même interagir avec des logiciels ou des bases de données.

Leur puissance vient de leur capacité de généralisation, mais cela s’accompagne souvent d’un coût élevé en calcul, en énergie et en latence.

2. Qu’est-ce qu’un SLM ?

À l’opposé, un SLM est un modèle de langage plus léger, souvent entraîné sur des corpus de données plus ciblés et avec un nombre de paramètres réduit. Les SLM comme Gemma 2B (de Google) ou Phi-3 Mini (de Microsoft) sont conçus pour fonctionner sur des appareils embarqués (voiture moderne, drone…) ou en local (votre ordinateur, votre téléphone portable). Ils sont capables de répondre rapidement à des requêtes...

Principaux modèles du marché

Les modèles de langage à grande échelle (LLM) et à plus petite échelle (SLM) dominent l’IA en 2025.

Voici une synthèse des six modèles majeurs du marché  : GPT (OpenAI), Claude (Anthropic), LLaMA (Meta), Mistral (Mistral AI), Gemini (Google DeepMind) et Phi (Microsoft).

1. GPT (OpenAI) : le généraliste ultra-polyvalent

OpenAI est une start-up américaine cofondée par Sam Altman et soutenue par Microsoft. GPT-4, lancé en 2023, est le fer de lance de cette gamme de modèles fermés (code et données non publics). En 2025, OpenAI a déployé des évolutions comme GPT-4.1, améliorant encore la vitesse (+40 %) et la mémoire contextuelle (support de très longues entrées (prompts)). GPT-4 excelle aussi en multimodalité, comprenant non seulement le texte mais aussi les images dans certaines versions (GPT-4o par exemple).

GPT utilise l’architecture Transformer entraînée sur d’énormes corpus textuels. Le nombre exact de paramètres n’est pas public mais est estimé à plusieurs centaines de milliards. GPT-4.1 a démontré une capacité à traiter jusqu’à 1 million de tokens via des astuces d’architecture, facilitant par exemple l’analyse de bases documentaires entières. Il offre également des fonctions avancées comme l’appel de fonctions externes et la génération structurée (JSON, etc.), très utiles pour l’intégration sur des applications d’entreprise. 

GPT est réputé pour sa performance. Il génère des textes fluides et cohérents qui passent souvent pour du langage humain. Il se distingue en codage et en résolution de problèmes complexes.

Sa communauté et son écosystème sont incomparables : des millions d’utilisateurs l’emploient via ChatGPT, et de nombreuses applications tierces intègrent son API.

En somme, GPT est le « couteau suisse » de l’IA : son adaptabilité lui permet de briller dans de multiples domaines (du support client à l’écriture créative), ce qui en fait un choix...