13 février 2026
Réduisez vos coûts OpenClaw de 97 % : guide d’optimisation des tokens
La configuration par défaut d’OpenClaw privilégie la capacité au détriment du coût. Vous gaspillez probablement des tokens sur des tâches courantes qui n’ont pas besoin de modèles coûteux. Voici comment passer de 1 500 $/mois à moins de 50 $.
97 %
Réduction des coûts
5 min
À mettre en place
<50 $
Objectif mensuel
Si vous utilisez OpenClaw et que vos factures API grimpent, vous n’êtes pas seul. Ce guide couvre cinq optimisations qui fonctionnent ensemble pour réduire les coûts : initialisation de session, model routing, heartbeat local, limites de débit et prompt caching.
1. Initialisation de session
Votre agent charge 50 Ko d’historique à chaque message. Cela gaspille 2–3M de tokens par session et coûte 4 $/jour. Si vous utilisez des interfaces de messagerie tierces sans nettoyage de session intégré, le problème s’aggrave rapidement.
La solution : ajoutez une règle d’initialisation de session dans les instructions de votre agent. Indiquez-lui exactement quoi charger — et quoi NE PAS charger — au démarrage de la session.
# Session Initialization Rule (add to AGENTS.md)
On every session start:
1. Load ONLY these files:
- SOUL.md
- USER.md
- IDENTITY.md
- memory/YYYY-MM-DD.md (if it exists)
2. DO NOT auto-load:
- MEMORY.md
- Session history
- Prior messages
- Previous tool outputs
3. When user asks about prior context:
- Use memory_search() on demand
- Pull only the relevant snippet
- Don't load the whole file
4. Update memory/YYYY-MM-DD.md at end of session:
- What you worked on
- Decisions made
- Blockers and next stepsAvant
- ×50 Ko de contexte au démarrage
- ×2–3M de tokens gaspillés par session
- ×0,40 $ par session
- ×Historique qui enfle au fil du temps
Après
- +8 Ko de contexte au démarrage
- +Charge uniquement le nécessaire
- +0,05 $ par session
- +Fichiers mémoire quotidiens propres
2. Model Routing
Par défaut, OpenClaw utilise Claude Sonnet pour tout. Bien que Sonnet soit excellent, c’est excessif pour vérifier l’état d’un fichier, exécuter des commandes simples ou effectuer une surveillance de routine. Haiku gère parfaitement ces tâches pour une fraction du coût. Pour un comparatif complet des modèles, consultez notre guide de sélection des modèles.
// ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
}
}
}
}Ajoutez ensuite des règles de routage dans les instructions de votre agent :
# Model Selection Rule (add to AGENTS.md)
Default: Always use Haiku
Switch to Sonnet ONLY when:
- Architecture decisions
- Production code review
- Security analysis
- Complex debugging/reasoning
- Strategic multi-project decisions
When in doubt: try Haiku first.| Métrique | Avant (Sonnet) | Après (Haiku par défaut) |
|---|---|---|
| Coût pour 1K tokens | 0,003 $ | 0,00025 $ |
| Coût mensuel du modèle | 50–70 $ | 5–10 $ |
| Vitesse des tâches courantes | Surdimensionné | Adapté |
3. Rediriger le heartbeat vers Haiku
OpenClaw envoie des vérifications heartbeat périodiques pour confirmer que votre agent est actif. Par défaut, celles-ci utilisent votre modèle principal — ce qui s’accumule vite en fonctionnement 24h/24. Redirigez-les vers Haiku 4.5, le modèle Claude le moins cher, et réduisez la fréquence à une fois par heure.
// Add to ~/.openclaw/openclaw.json
{
"heartbeat": {
"every": "1h",
"model": "anthropic/claude-haiku-4-5",
"session": "main",
"prompt": "Check: Any blockers or progress updates?"
}
}Avant : 1 440 appels Sonnet/jour, 5–15 $/mois rien que pour les heartbeats. Après : 24 appels Haiku/jour, moins de 0,50 $/mois. Haiku 4.5 est 12x moins cher que Sonnet et gère parfaitement le contexte du heartbeat.
4. Limites de débit et contrôles budgétaires
Même avec le model routing et des sessions optimisées, une automatisation incontrôlée peut consumer des tokens. Ces garde-fous empêchent les explosions de coûts accidentelles.
# Rate Limits (add to AGENTS.md)
RATE LIMITS:
- 5 seconds minimum between API calls
- 10 seconds between web searches
- Max 5 searches per batch, then 2-minute break
- Batch similar work (one request for 10 leads,
not 10 requests for 1 lead each)
- If you hit 429 error: STOP, wait 5 minutes, retry
DAILY BUDGET: $5 (warning at 75%)
MONTHLY BUDGET: $200 (warning at 75%)| Limite | Ce qu’elle prévient |
|---|---|
| 5s entre les appels API | Consommation rapide de tokens |
| 10s entre les recherches | Boucles de recherche coûteuses |
| 5 recherches max, puis pause | Tâches de recherche incontrôlées |
| Regrouper les tâches similaires | 10 appels quand 1 suffit |
| Alertes budget à 75 % | Factures surprises |
5. Prompt Caching
Votre prompt système, vos fichiers de workspace et vos documents de référence sont envoyés à l’API à chaque message. Le prompt caching (disponible sur Claude 3.5 Sonnet et versions ultérieures) ne facture que 10 % pour les tokens en cache lors de la réutilisation. Pour le contenu statique envoyé de manière répétée, cela réduit les coûts de 90 %.
Première requête : plein tarif. Claude le stocke en cache. Requêtes suivantes dans les 5 minutes : 90 % de réduction.
Un prompt système de 5 Ko coûte environ 0,015 $ à la première utilisation, puis 0,0015 $ à chaque réutilisation. Sur 100 appels/semaine, vous économisez environ 1,30 $/semaine rien que sur les prompts système.
Quoi mettre en cache ou non
Mettre en cache (stable)
- +Prompts système
- +SOUL.md / USER.md
- +Documents de référence, docs, specs
- +Documentation des outils
- +Modèles de projet
Ne pas mettre en cache (dynamique)
- ×Fichiers mémoire quotidiens
- ×Messages récents de l'utilisateur
- ×Sorties des outils
- ×Notes fréquemment mises à jour
// Enable caching in ~/.openclaw/openclaw.json
{
"agents": {
"defaults": {
"cache": {
"enabled": true,
"ttl": "5m",
"priority": "high"
}
}
}
}Maximiser les hits de cache
- +Regrouper les requêtes : Faites plusieurs appels API dans des fenêtres de 5 minutes pour réutiliser les prompts en cache
- +Garder les prompts stables : Ne modifiez pas SOUL.md en cours de session — les changements invalident le cache
- +Séparer le stable du dynamique : Documents de référence (en cache) vs. notes quotidiennes (hors cache) dans des fichiers séparés
- +Viser >80 % de hit rate : Surveillez avec session_status et ajustez si les échecs de cache sont élevés
| Exemple : 50 brouillons de prospection/semaine | Sans cache | Avec cache |
|---|---|---|
| Coût du prompt système | 0,75 $/semaine | 0,02 $/semaine |
| Génération de brouillons | 1,20 $/semaine | 0,60 $/semaine |
| Total mensuel | 102 $ | 32 $ |
Impact combiné
Chaque optimisation cible un facteur de coût différent. Ensemble, elles se cumulent :
| Optimisation | Avant | Après | Avec cache |
|---|---|---|---|
| Init. session | 0,40 $ | 0,05 $ | 0,005 $ |
| Model routing | 0,05 $ | 0,02 $ | 0,002 $ |
| Heartbeat | 0,02 $ | 0 $ | 0 $ |
| Limites de débit | — | 0 $ | 0 $ |
| Prompt caching | — | — | −0,015 $ |
2–3 $
Quotidien avant
0,10 $
Quotidien après
3–5 $
Mensuel après
Vérifier votre configuration
# Start a session and check status
openclaw shell
session_status
# You should see:
# - Context size: 2-8KB (not 50KB+)
# - Model: Haiku (not Sonnet)
# - Heartbeat: Haiku (not Sonnet)
# - Cache hit rate: >80%Dépannage
- +Contexte toujours volumineux : Vérifiez que les règles d'initialisation de session sont dans votre AGENTS.md
- +Utilise toujours Sonnet : Vérifiez la syntaxe de openclaw.json et le chemin model.primary
- +Erreurs de heartbeat : Vérifiez que heartbeat.model est bien anthropic/claude-haiku-4-5 dans openclaw.json
- +Coûts inchangés : Vérifiez que votre prompt système est bien chargé
En résumé
Cinq optimisations. Cinq minutes chacune. Résultat combiné : de 1 500 $/mois à moins de 50 $. C’est de l’argent que vous pouvez réinvestir dans la construction de vos projets.
Ces économies sont particulièrement utiles pour les workflows à haut volume comme la prospection automatisée ou la création de contenu à grande échelle.
Sur founders.sh, nous appliquons ces optimisations par défaut sur chaque conteneur d’agent que nous déployons. Vous bénéficiez du model routing, de la gestion de session et des contrôles de coûts dès l’installation — sans toucher à un fichier de configuration.
Envie d’agents optimisés sans configuration ?
Les agents founders.sh sont préconfigurés avec l’optimisation des coûts, le model routing et la gestion intelligente des sessions — opérationnels en 60 secondes.
DémarrerContinuer la lecture
Les meilleurs modèles pour OpenClaw en 2026
Anthropic, OpenAI, Google, open-source — les compromis en termes de coût, de capacité et de confidentialité pour chaque fournisseur.
Comment booker 60+ appels/mois avec des agents IA de prospection
Le système multi-canal complet pour automatiser la prospection sur Twitter, LinkedIn et email.