Assemblage du contexte
L'assemblage du contexte est le mécanisme central de ThreadMind — il construit un contexte ciblé à partir de l'arborescence pour l'envoyer au modèle IA.
Fonctionnement
Quand vous appelez context_get (ou tm:context) ou lisez la ressource threadmind://context, ThreadMind :
- Part du thread actif
- Remonte l'arbre en suivant les liens
parentIdjusqu'à la racine - Inverse la chaîne (racine → ... → actif)
- Concatène le contexte système + tous les résumés dans l'ordre
- Estime le nombre de tokens (~1 token pour 3,5 caractères)
Exemple
Étant donné cet arbre :
main ("Vue d'ensemble : e-commerce Next.js...")
├── auth ("Auth JWT avec refresh tokens...")
│ ├── auth-ui ("Formulaire login, page inscription...") ← actif
│ └── auth-api ("POST /login, POST /register...")
└── dashboard ("Tableau de bord admin avec graphiques...")Le contexte assemblé pour auth-ui est :
## Contexte système
Construction d'une application e-commerce Next.js avec Stripe.
---
## Thread : Mon App
Vue d'ensemble : e-commerce Next.js avec PostgreSQL...
---
## Thread : Auth
Auth JWT avec refresh tokens, bcrypt, Passport.js...
---
## Thread : Auth UI (actif)
Formulaire de login email/mot de passe, page d'inscription
avec validation, flux mot de passe oublié...
---
_ThreadMind context: ~450 tokens | depth: 4 threads_
_Estimated raw history: ~12,000 tokens (~96% reduction from 8 summary updates)_Ce qui est exclu
- Les threads frères (
auth-apin'est pas inclus) - Les autres branches (
dashboardn'est pas inclus) - Les résumés vides (les threads sans contenu sont ignorés)
C'est intentionnel — seul le contexte ancestral direct compte pour le thread actuel.
Estimation des tokens
Chaque réponse de context_get inclut un pied de page avec :
- Tokens du contexte ThreadMind — nombre approximatif de tokens du contexte assemblé
- Historique brut estimé — combien de tokens les inputs cumulatifs des résumés auraient coûté (affiché après au moins un
summary_update) - Pourcentage de réduction — le ratio de compression
L'estimation utilise ~3,5 caractères par token, ce qui est conservateur (légère surestimation).
INFO
Les estimations de tokens sont approximatives. Le protocole MCP ne permet pas d'accéder à la consommation réelle de tokens du modèle. Toutes les métriques sont dérivées du texte que ThreadMind stocke et sert.
Vérifier les économies de tokens
Utilisez stats_show (ou tm:stats) pour obtenir un rapport détaillé :
ThreadMind Stats: "Mon Projet"
Overview:
Threads: 5 (3 with tracked updates)
Summary updates: 12
Current context: ~450 tokens (depth: 3)
Token Savings (estimated):
Estimated raw history: ~12,000 tokens
ThreadMind context: ~450 tokens
Reduction: ~96%
Per-Thread Breakdown:
Thread Updates Current Cumulative Ratio
main 4 ~120 ~3400 96%
auth-system 3 ~90 ~2800 97%
auth-ui 5 ~85 ~5800 99%Fonctionnement : Chaque appel à summary_update est tracké. L'input cumulé représente le texte total compressé en résumés au fil du temps. Le ratio compare cet input cumulé au contexte assemblé actuel — montrant la compression réalisée par ThreadMind.
Économies de tokens
Considérons un projet typique avec 5 niveaux de threads, chacun avec un résumé de 10 lignes (~100 tokens) :
| Approche | Tokens envoyés |
|---|---|
| Historique complet (100 messages) | ~50 000 tokens |
| Contexte ThreadMind (5 résumés) | ~500 tokens |
| Économie | ~99% |
Même avec des résumés généreux (500 tokens chacun), une chaîne de 5 niveaux ne coûte que 2 500 tokens — une réduction massive.
Utiliser le contexte
Comme outil
context_getOu avec le raccourci :
tm:contextRetourne le contexte assemblé sous forme de texte. Utilisez-le pour injecter explicitement le contexte dans votre conversation.
Comme ressource
La ressource threadmind://context expose le même contexte. Les clients MCP qui supportent les ressources peuvent l'afficher ou l'injecter automatiquement.
Stratégies d'organisation
Arbres peu profonds pour les projets simples
main
├── feature-a
├── feature-b
└── feature-cChaque fonctionnalité a son thread directement sous main. Contexte = main + feature courante.
Arbres profonds pour les sujets complexes
main
└── auth
└── oauth
└── google-provider
└── bug-refresh-tokenQuand un sujet nécessite une exploration approfondie, les threads imbriqués gardent chaque niveau focalisé.
Approche hybride
main
├── backend
│ ├── auth
│ │ └── oauth
│ └── api
│ ├── routes
│ └── middleware
└── frontend
├── composants
└── gestion-etatOrganisez par couche architecturale, puis par fonctionnalité dans chaque couche.
TIP
La profondeur idéale d'un arbre est de 3-5 niveaux. Des arbres plus profonds signifient plus de contexte par assemblage, ce qui réduit partiellement l'intérêt. Si vous allez plus profond, gardez les résumés très concis.
Protections
- Détection de références circulaires — si une chaîne de parents forme une boucle (ne devrait jamais arriver), ThreadMind lève une erreur
- Limite de profondeur — les chaînes sont plafonnées à 50 niveaux pour éviter une traversée infinie