?
SkillintermédiaireVérifié le 2025-05

Long context (1M tokens) : cas d'usage

Stratégies pour exploiter la fenêtre de contexte massive de Gemini.

La fenêtre de contexte de 1 million de tokens

Gemini 2.5 Pro offre une fenêtre de contexte allant jusqu'à 1 million de tokens, soit l'équivalent d'environ 700 000 mots ou 1 500 pages. C'est la plus grande fenêtre de contexte disponible parmi les modèles de fondation majeurs.

Cas d'usage idéaux

Analyse de documents longs

  • Analyser un contrat juridique complet (100+ pages) en une seule requête
  • Résumer un livre entier avec ses nuances
  • Comparer plusieurs documents volumineux entre eux

Codebase complète

  • Charger un repository entier pour du code review
  • Comprendre l'architecture d'un projet sans navigation fichier par fichier
  • Détecter des patterns ou incohérences à travers tout le code

Vidéo et audio longs

  • Analyser une heure de vidéo en une seule requête
  • Transcrire et résumer des réunions longues
  • Extraire des informations spécifiques d'un podcast complet

Stratégies d'utilisation

1. Structurer le contexte

prompt = """
Voici un document de 500 pages. 
Réponds aux questions suivantes en citant les pages pertinentes :
1. Quelles sont les clauses de résiliation ?
2. Quels sont les délais de paiement ?
"""

2. Needle-in-a-haystack

Gemini excelle à retrouver des informations spécifiques dans un contexte massif. Posez des questions précises plutôt que vagues.

3. Chunking intelligent

Même avec 1M tokens, structurez votre input : - Ajoutez des séparateurs clairs entre documents - Utilisez des en-têtes pour chaque section - Placez vos instructions au début ET à la fin du prompt

Considérations de coût

  • Plus le contexte est long, plus le coût par requête est élevé
  • Utilisez le caching de contexte pour des requêtes répétées sur le même document
  • Gemini 2.5 Flash est plus économique pour les cas où la qualité maximale n'est pas requise

Limites

  • La qualité peut diminuer légèrement sur les très longs contextes
  • Le temps de réponse augmente avec la taille du contexte
  • Le caching de contexte aide à réduire la latence sur les requêtes répétées

Sources

Geminicontextlong-document