Module 3

Construire avec les APIs

Intégrer les LLMs dans des applications réelles : architecture, patterns et bonnes pratiques.

Praticien~8h5 sous-modules21 leçons

3.1Architecture d'une app IA

▶

Vidéo · 15 minVidéo à venir

Anatomie d'une application IA moderne

Les couches d'une app IA : UI, orchestration, LLM, outils, données. Où se situe la complexité.

▶

Vidéo · 12 minVidéo à venir

Patterns d'architecture : proxy, gateway, router

Les trois patterns principaux pour structurer l'accès aux LLMs dans une app.

▶

Vidéo · 10 minVidéo à venir

Sécurité : API keys, rate limiting, input validation

Protéger votre application des abus et des injections de prompt.

✎

Exercice · 20 minVidéo à venir

Exercice : dessiner l'architecture d'un cas d'usage

Concevoir l'architecture d'un assistant de support client avec diagramme.

3.2Intégrer Claude / OpenAI / Gemini

▶

Vidéo · 15 minVidéo à venir

SDK Anthropic : premiers appels à Claude

Installer le SDK, configurer l'authentification et faire ses premiers appels API.

▶

Vidéo · 12 minVidéo à venir

SDK OpenAI : chat completions et beyond

L'API OpenAI en pratique : chat, embeddings, modération.

▶

Vidéo · 12 minVidéo à venir

Google AI SDK : Gemini en production

Intégrer Gemini via le SDK Google avec gestion des modèles et quotas.

▶

Vidéo · 10 minVidéo à venir

Abstraction multi-provider : AI SDK de Vercel

Utiliser une couche d'abstraction pour switcher de provider sans changer le code.

◆

Projet · 30 minVidéo à venir

Projet : app Next.js avec chat multi-modèle

Construire une interface de chat qui peut utiliser Claude, GPT ou Gemini.

3.3Streaming, retry, error handling

▶

Vidéo · 12 minVidéo à venir

Streaming SSE : affichage token par token

Implémenter le streaming Server-Sent Events pour un affichage progressif.

▶

Vidéo · 8 minVidéo à venir

Retry avec backoff exponentiel

Gérer les erreurs transitoires (429, 500, 529) avec une stratégie de retry robuste.

▶

Vidéo · 10 minVidéo à venir

Timeout, fallback et circuit breaker

Patterns de résilience pour des applications IA qui ne tombent jamais.

✎

Exercice · 25 minVidéo à venir

Exercice : implémenter un client résilient

Coder un wrapper API avec streaming, retry, timeout et fallback multi-provider.

3.4Prompt caching et optimisation des coûts

▶

Vidéo · 12 minVidéo à venir

Prompt caching : principes et implémentation

Comprendre le cache de prompts Anthropic/OpenAI et réduire les coûts de 90%.

▶

Vidéo · 8 minVidéo à venir

Optimiser la longueur des prompts

Techniques pour réduire les tokens sans perdre en qualité de réponse.

▶

Vidéo · 10 minVidéo à venir

Routing intelligent : gros modèle vs petit modèle

Router automatiquement les requêtes vers le modèle le plus adapté (et le moins cher).

▶

Vidéo · 8 minVidéo à venir

Monitoring des coûts en temps réel

Mettre en place un dashboard de suivi des coûts par feature, par user, par modèle.

3.5Tool use et function calling

▶

Vidéo · 12 minVidéo à venir

Principes du tool use : donner des mains au LLM

Comment fonctionne le tool use et quand l'utiliser dans vos applications.

▶

Vidéo · 10 minVidéo à venir

Définir des tools : schémas et descriptions

Écrire des définitions de tools claires que le modèle utilisera correctement.

▶

Vidéo · 15 minVidéo à venir

Orchestration multi-tools et boucle agentique

Gérer les appels multiples, la validation des inputs et la boucle tool use.

◆

Projet · 35 minVidéo à venir

Projet : assistant avec accès à une base de données

Construire un assistant qui peut interroger une DB via des tools définis.