13 février 2026

Réduisez vos coûts OpenClaw de 97 % : guide d’optimisation des tokens

La configuration par défaut d’OpenClaw privilégie la capacité au détriment du coût. Vous gaspillez probablement des tokens sur des tâches courantes qui n’ont pas besoin de modèles coûteux. Voici comment passer de 1 500 $/mois à moins de 50 $.

97 %

Réduction des coûts

5 min

À mettre en place

<50 $

Objectif mensuel

Si vous utilisez OpenClaw et que vos factures API grimpent, vous n’êtes pas seul. Ce guide couvre cinq optimisations qui fonctionnent ensemble pour réduire les coûts : initialisation de session, model routing, heartbeat local, limites de débit et prompt caching.

1. Initialisation de session

Le problème

Votre agent charge 50 Ko d’historique à chaque message. Cela gaspille 2–3M de tokens par session et coûte 4 $/jour. Si vous utilisez des interfaces de messagerie tierces sans nettoyage de session intégré, le problème s’aggrave rapidement.

La solution : ajoutez une règle d’initialisation de session dans les instructions de votre agent. Indiquez-lui exactement quoi charger — et quoi NE PAS charger — au démarrage de la session.

# Session Initialization Rule (add to AGENTS.md)

On every session start:
1. Load ONLY these files:
   - SOUL.md
   - USER.md
   - IDENTITY.md
   - memory/YYYY-MM-DD.md (if it exists)

2. DO NOT auto-load:
   - MEMORY.md
   - Session history
   - Prior messages
   - Previous tool outputs

3. When user asks about prior context:
   - Use memory_search() on demand
   - Pull only the relevant snippet
   - Don't load the whole file

4. Update memory/YYYY-MM-DD.md at end of session:
   - What you worked on
   - Decisions made
   - Blockers and next steps

Avant

  • ×50 Ko de contexte au démarrage
  • ×2–3M de tokens gaspillés par session
  • ×0,40 $ par session
  • ×Historique qui enfle au fil du temps

Après

  • +8 Ko de contexte au démarrage
  • +Charge uniquement le nécessaire
  • +0,05 $ par session
  • +Fichiers mémoire quotidiens propres

2. Model Routing

Par défaut, OpenClaw utilise Claude Sonnet pour tout. Bien que Sonnet soit excellent, c’est excessif pour vérifier l’état d’un fichier, exécuter des commandes simples ou effectuer une surveillance de routine. Haiku gère parfaitement ces tâches pour une fraction du coût. Pour un comparatif complet des modèles, consultez notre guide de sélection des modèles.

// ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      }
    }
  }
}

Ajoutez ensuite des règles de routage dans les instructions de votre agent :

# Model Selection Rule (add to AGENTS.md)

Default: Always use Haiku
Switch to Sonnet ONLY when:
- Architecture decisions
- Production code review
- Security analysis
- Complex debugging/reasoning
- Strategic multi-project decisions

When in doubt: try Haiku first.
MétriqueAvant (Sonnet)Après (Haiku par défaut)
Coût pour 1K tokens0,003 $0,00025 $
Coût mensuel du modèle50–70 $5–10 $
Vitesse des tâches courantesSurdimensionnéAdapté

3. Rediriger le heartbeat vers Haiku

OpenClaw envoie des vérifications heartbeat périodiques pour confirmer que votre agent est actif. Par défaut, celles-ci utilisent votre modèle principal — ce qui s’accumule vite en fonctionnement 24h/24. Redirigez-les vers Haiku 4.5, le modèle Claude le moins cher, et réduisez la fréquence à une fois par heure.

// Add to ~/.openclaw/openclaw.json
{
  "heartbeat": {
    "every": "1h",
    "model": "anthropic/claude-haiku-4-5",
    "session": "main",
    "prompt": "Check: Any blockers or progress updates?"
  }
}
Résultat

Avant : 1 440 appels Sonnet/jour, 5–15 $/mois rien que pour les heartbeats. Après : 24 appels Haiku/jour, moins de 0,50 $/mois. Haiku 4.5 est 12x moins cher que Sonnet et gère parfaitement le contexte du heartbeat.

4. Limites de débit et contrôles budgétaires

Même avec le model routing et des sessions optimisées, une automatisation incontrôlée peut consumer des tokens. Ces garde-fous empêchent les explosions de coûts accidentelles.

# Rate Limits (add to AGENTS.md)

RATE LIMITS:
- 5 seconds minimum between API calls
- 10 seconds between web searches
- Max 5 searches per batch, then 2-minute break
- Batch similar work (one request for 10 leads,
  not 10 requests for 1 lead each)
- If you hit 429 error: STOP, wait 5 minutes, retry

DAILY BUDGET: $5 (warning at 75%)
MONTHLY BUDGET: $200 (warning at 75%)
LimiteCe qu’elle prévient
5s entre les appels APIConsommation rapide de tokens
10s entre les recherchesBoucles de recherche coûteuses
5 recherches max, puis pauseTâches de recherche incontrôlées
Regrouper les tâches similaires10 appels quand 1 suffit
Alertes budget à 75 %Factures surprises

5. Prompt Caching

Votre prompt système, vos fichiers de workspace et vos documents de référence sont envoyés à l’API à chaque message. Le prompt caching (disponible sur Claude 3.5 Sonnet et versions ultérieures) ne facture que 10 % pour les tokens en cache lors de la réutilisation. Pour le contenu statique envoyé de manière répétée, cela réduit les coûts de 90 %.

Comment ça marche

Première requête : plein tarif. Claude le stocke en cache. Requêtes suivantes dans les 5 minutes : 90 % de réduction.

Un prompt système de 5 Ko coûte environ 0,015 $ à la première utilisation, puis 0,0015 $ à chaque réutilisation. Sur 100 appels/semaine, vous économisez environ 1,30 $/semaine rien que sur les prompts système.

Quoi mettre en cache ou non

Mettre en cache (stable)

  • +Prompts système
  • +SOUL.md / USER.md
  • +Documents de référence, docs, specs
  • +Documentation des outils
  • +Modèles de projet

Ne pas mettre en cache (dynamique)

  • ×Fichiers mémoire quotidiens
  • ×Messages récents de l'utilisateur
  • ×Sorties des outils
  • ×Notes fréquemment mises à jour
// Enable caching in ~/.openclaw/openclaw.json
{
  "agents": {
    "defaults": {
      "cache": {
        "enabled": true,
        "ttl": "5m",
        "priority": "high"
      }
    }
  }
}

Maximiser les hits de cache

  • +Regrouper les requêtes : Faites plusieurs appels API dans des fenêtres de 5 minutes pour réutiliser les prompts en cache
  • +Garder les prompts stables : Ne modifiez pas SOUL.md en cours de session — les changements invalident le cache
  • +Séparer le stable du dynamique : Documents de référence (en cache) vs. notes quotidiennes (hors cache) dans des fichiers séparés
  • +Viser >80 % de hit rate : Surveillez avec session_status et ajustez si les échecs de cache sont élevés
Exemple : 50 brouillons de prospection/semaineSans cacheAvec cache
Coût du prompt système0,75 $/semaine0,02 $/semaine
Génération de brouillons1,20 $/semaine0,60 $/semaine
Total mensuel102 $32 $

Impact combiné

Chaque optimisation cible un facteur de coût différent. Ensemble, elles se cumulent :

OptimisationAvantAprèsAvec cache
Init. session0,40 $0,05 $0,005 $
Model routing0,05 $0,02 $0,002 $
Heartbeat0,02 $0 $0 $
Limites de débit0 $0 $
Prompt caching−0,015 $

2–3 $

Quotidien avant

0,10 $

Quotidien après

3–5 $

Mensuel après

Vérifier votre configuration

# Start a session and check status
openclaw shell
session_status

# You should see:
# - Context size: 2-8KB (not 50KB+)
# - Model: Haiku (not Sonnet)
# - Heartbeat: Haiku (not Sonnet)
# - Cache hit rate: >80%

Dépannage

  • +Contexte toujours volumineux : Vérifiez que les règles d'initialisation de session sont dans votre AGENTS.md
  • +Utilise toujours Sonnet : Vérifiez la syntaxe de openclaw.json et le chemin model.primary
  • +Erreurs de heartbeat : Vérifiez que heartbeat.model est bien anthropic/claude-haiku-4-5 dans openclaw.json
  • +Coûts inchangés : Vérifiez que votre prompt système est bien chargé

En résumé

Cinq optimisations. Cinq minutes chacune. Résultat combiné : de 1 500 $/mois à moins de 50 $. C’est de l’argent que vous pouvez réinvestir dans la construction de vos projets.

Ces économies sont particulièrement utiles pour les workflows à haut volume comme la prospection automatisée ou la création de contenu à grande échelle.

Sur founders.sh, nous appliquons ces optimisations par défaut sur chaque conteneur d’agent que nous déployons. Vous bénéficiez du model routing, de la gestion de session et des contrôles de coûts dès l’installation — sans toucher à un fichier de configuration.

Envie d’agents optimisés sans configuration ?

Les agents founders.sh sont préconfigurés avec l’optimisation des coûts, le model routing et la gestion intelligente des sessions — opérationnels en 60 secondes.

Démarrer