?
SkillintermédiaireVérifié le 2025-05

Extended thinking : raisonnement pas à pas

Activer et exploiter le mode de réflexion étendue pour les tâches complexes.

Qu'est-ce que l'Extended Thinking ?

L'Extended Thinking (pensée étendue) est un mode qui permet à Claude de raisonner étape par étape avant de répondre. Claude génère d'abord un processus de réflexion interne (visible ou non), puis formule sa réponse finale. Cela améliore significativement la qualité sur les tâches complexes.

Activation via l'API

const response = await client.messages.create({
  model: "claude-opus-4-20250514",
  max_tokens: 16000,
  thinking: {
    type: "enabled",
    budget_tokens: 10000
  },
  messages: [{
    role: "user",
    content: "Résous ce problème d'optimisation..."
  }]
});

Le budget de tokens de réflexion

Le paramètre budget_tokens contrôle combien de tokens Claude peut utiliser pour sa réflexion interne : - Minimum : 1024 tokens - Recommandé : 5000-10000 pour la plupart des tâches - Maximum : Dépend du modèle et du max_tokens

Claude n'utilise pas nécessairement tout le budget — il s'arrête quand sa réflexion est suffisante.

Structure de la réponse

Avec l'Extended Thinking activé, la réponse contient deux types de blocs :

{
  "content": [
    {
      "type": "thinking",
      "thinking": "Analysons le problème étape par étape...\n1. D'abord..."
    },
    {
      "type": "text",
      "text": "La solution optimale est..."
    }
  ]
}

Quand utiliser l'Extended Thinking

Idéal pour : - Problèmes mathématiques : Calculs multi-étapes, preuves - Code complexe : Architecture, debugging, algorithmes - Analyse stratégique : Décisions avec multiples facteurs - Raisonnement logique : Puzzles, contradictions à résoudre - Planification : Plans d'action avec dépendances

Pas nécessaire pour : - Résumés simples - Traductions - Extraction de données structurées - Conversations informelles - Tâches de classification simples

Bonnes pratiques

1. Ajustez le budget à la complexité

// Tâche modérée
thinking: { type: "enabled", budget_tokens: 5000 }

// Tâche très complexe
thinking: { type: "enabled", budget_tokens: 15000 }

2. Utilisez avec les bons modèles

L'Extended Thinking est particulièrement puissant avec Claude Opus 4, qui peut utiliser jusqu'à 1M de contexte avec cette fonctionnalité.

3. Combinez avec un prompt structuré

Même avec l'Extended Thinking, un prompt bien structuré améliore les résultats :

Analyse ce code et identifie tous les bugs potentiels.
Pour chaque bug :
- Localisation exacte
- Nature du problème
- Sévérité (critique/important/mineur)
- Correction proposée

4. Affichez la réflexion (optionnel)

Dans certains cas (éducation, transparence), montrer le processus de réflexion à l'utilisateur ajoute de la valeur. Dans d'autres cas (chatbot grand public), masquez-le pour simplifier l'expérience.

Impact sur les coûts

Les tokens de réflexion sont facturés comme des tokens de sortie. Prévoyez un budget 2-5x supérieur par requête comparé au mode standard. Le ROI est positif quand la qualité des réponses justifie le surcoût.

Sources

thinkingraisonnementcomplexité