Fine-tuning & Spécialisation
Adapter un modèle existant à vos données et votre domaine pour des performances supérieures.
7.1Quand fine-tuner
Prompting vs RAG vs fine-tuning : l'arbre de décision
Un framework clair pour choisir la bonne approche selon votre problème.
Cas d'usage où le fine-tuning excelle
Les scénarios où le fine-tuning apporte un avantage décisif : style, format, domaine.
Coûts et ROI du fine-tuning
Calculer si le fine-tuning vaut l'investissement par rapport aux alternatives.
Quiz : fine-tuning ou pas ?
Évaluer 10 scénarios et décider si le fine-tuning est la bonne approche.
7.2Préparation des données
Format et structure des données de training
Préparer des données au bon format : JSONL, conversations, instructions.
Qualité > quantité : curation des exemples
Sélectionner et nettoyer les exemples pour un training efficace.
Data augmentation pour le fine-tuning
Techniques pour enrichir un dataset limité avec des variations synthétiques.
Exercice : préparer un dataset de 500 exemples
Créer, nettoyer et formater un dataset de fine-tuning à partir de données brutes.
7.3Techniques de fine-tuning
LoRA : fine-tuning efficient en mémoire
Comprendre et implémenter LoRA pour fine-tuner avec un GPU consumer.
QLoRA : quantization + LoRA
Combiner quantization et LoRA pour fine-tuner des modèles 70B sur un seul GPU.
Full fine-tune : quand et comment
Les cas où un full fine-tune est justifié et l'infrastructure nécessaire.
Hyperparamètres : learning rate, epochs, batch size
Guide pratique pour choisir les bons hyperparamètres et éviter l'overfitting.
Projet : fine-tuner Llama sur un domaine spécifique
Fine-tuner un modèle Llama sur des données métier avec évaluation.
7.4Évaluation post-training
Mesurer l'amélioration vs le modèle de base
Évaluer objectivement les gains du fine-tuning sur votre tâche cible.
Détecter l'overfitting et le catastrophic forgetting
Identifier quand le modèle a trop appris ou oublié ses capacités générales.
Itérer : quand relancer un training
Décider quand le modèle est assez bon et quand il faut ajuster les données.
7.5Déploiement d'un modèle custom
Exporter et packager un modèle fine-tuné
Préparer un modèle pour le déploiement : merge, conversion, optimisation.
Serving : vLLM, TGI ou managed API
Options de déploiement pour servir votre modèle custom en production.
A/B testing : modèle custom vs base model
Comparer en production votre modèle fine-tuné contre le modèle de base.
Projet final : pipeline fine-tuning end-to-end
Construire un pipeline complet de la donnée au modèle déployé en production.