La fenêtre de contexte de 1 million de tokens
Gemini 2.5 Pro offre une fenêtre de contexte allant jusqu'à 1 million de tokens, soit l'équivalent d'environ 700 000 mots ou 1 500 pages. C'est la plus grande fenêtre de contexte disponible parmi les modèles de fondation majeurs.
Cas d'usage idéaux
Analyse de documents longs
- Analyser un contrat juridique complet (100+ pages) en une seule requête
- Résumer un livre entier avec ses nuances
- Comparer plusieurs documents volumineux entre eux
Codebase complète
- Charger un repository entier pour du code review
- Comprendre l'architecture d'un projet sans navigation fichier par fichier
- Détecter des patterns ou incohérences à travers tout le code
Vidéo et audio longs
- Analyser une heure de vidéo en une seule requête
- Transcrire et résumer des réunions longues
- Extraire des informations spécifiques d'un podcast complet
Stratégies d'utilisation
1. Structurer le contexte
prompt = """
Voici un document de 500 pages.
Réponds aux questions suivantes en citant les pages pertinentes :
1. Quelles sont les clauses de résiliation ?
2. Quels sont les délais de paiement ?
"""2. Needle-in-a-haystack
Gemini excelle à retrouver des informations spécifiques dans un contexte massif. Posez des questions précises plutôt que vagues.
3. Chunking intelligent
Même avec 1M tokens, structurez votre input : - Ajoutez des séparateurs clairs entre documents - Utilisez des en-têtes pour chaque section - Placez vos instructions au début ET à la fin du prompt
Considérations de coût
- Plus le contexte est long, plus le coût par requête est élevé
- Utilisez le caching de contexte pour des requêtes répétées sur le même document
- Gemini 2.5 Flash est plus économique pour les cas où la qualité maximale n'est pas requise
Limites
- La qualité peut diminuer légèrement sur les très longs contextes
- Le temps de réponse augmente avec la taille du contexte
- Le caching de contexte aide à réduire la latence sur les requêtes répétées