Comprendre l'IA générative
Les fondamentaux pour comprendre comment fonctionnent les LLMs, leurs capacités et leurs limites.
1.1Comment fonctionne un LLM
Du texte aux tokens : la tokenization
Comprendre comment un LLM découpe le texte en unités de sens et pourquoi cela impacte les coûts et la qualité.
Attention et transformers en 10 minutes
L'architecture transformer expliquée simplement : self-attention, couches, et pourquoi ça marche.
Pré-entraînement et alignement (RLHF)
Les deux étapes clés qui transforment un modèle de prédiction en assistant utile.
Quiz : anatomie d'un LLM
Vérifiez votre compréhension des concepts fondamentaux des modèles de langage.
1.2Tokens, contexte et limites
Fenêtre de contexte : ce que le modèle 'voit'
Comprendre la fenêtre de contexte, son impact sur les applications et les stratégies pour la gérer.
Coûts et calcul de tokens
Estimer les coûts d'utilisation en fonction des tokens d'entrée et de sortie.
Limites : hallucinations, biais et raisonnement
Les limites fondamentales des LLMs et comment les anticiper dans vos applications.
Exercice : calculer le coût d'un cas d'usage
Estimation pratique du coût mensuel d'un chatbot de support avec différents modèles.
1.3Les familles de modèles
GPT (OpenAI) : historique et spécificités
L'évolution de GPT-2 à GPT-4o et les forces distinctives de la famille OpenAI.
Claude (Anthropic) : safety et capacités
La philosophie d'Anthropic, Constitutional AI, et ce qui distingue Claude.
Gemini (Google) : multimodal natif
L'approche multimodale de Google et l'intégration avec l'écosystème Google.
Llama et l'open source : liberté et responsabilité
L'écosystème open source autour de Llama et les implications du self-hosting.
1.4Choisir le bon modèle pour son cas d'usage
Matrice de décision : coût × qualité × latence
Framework pratique pour sélectionner le modèle optimal selon trois axes critiques.
Quand utiliser un petit modèle vs un grand
Identifier les tâches qui ne nécessitent pas un modèle frontier et économiser 10x.
Projet : recommander un modèle pour 3 cas d'usage
Analyser trois scénarios réels et recommander le modèle, le provider et l'architecture.