Un agent IA qui oublie tout d'un échange à l'autre reste un exécutant sans passé : il vous fait tout répéter. Lui donner une mémoire, c'est le rendre continu — il se souvient de vos préférences, retrouve vos documents, reprend une tâche là où elle s'était arrêtée. Mais une mémoire d'IA n'a rien d'un carnet fiable. Elle oublie le milieu de ce qu'on lui donne, elle garde parfois des souvenirs faux, et elle retient au passage des données que vous n'auriez pas confiées. Voici comment un agent se souvient, et comment garder la main sur ce qu'il retient.
Se souvenir : trois mémoires, pas une
Quand on parle de la mémoire d'un agent, on mélange en réalité trois mécanismes très différents (Fig. 1). Les confondre, c'est se tromper sur ce qu'il sait vraiment.
La première est le contexte de la session : la fenêtre de contexte, cette mémoire de travail qui contient votre conversation en cours. Elle est vaste mais éphémère — elle s'efface quand la session se ferme. La deuxième est la mémoire persistante, qui survit d'une session à l'autre. C'est elle que proposent désormais les grands assistants : ChatGPT retient des « souvenirs » que vous lui demandez de garder et tire aussi des enseignements de vos échanges passés ; Gemini apprend de vos conversations pour personnaliser ses réponses ; Claude sait résumer votre historique pour reprendre le fil. La troisième n'est pas vraiment une mémoire de l'agent : c'est le rappel de vos sources. Plutôt que de répondre « de mémoire », l'agent va chercher l'information dans vos documents et s'appuie dessus — c'est le principe de la génération augmentée par récupération, qui ancre la réponse sur des documents récupérés au lieu des seuls poids du modèle. C'est le prolongement direct de ce qui distingue un agent d'un assistant qui se contente de répondre.
Une mémoire d'IA n'est pas un carnet fiable
Ces trois mémoires ont chacune leur faille (Fig. 2), et aucune ne se comporte comme le classeur ordonné qu'on imagine.
Le premier piège tient à la fenêtre de contexte elle-même. On croit qu'un agent « lit tout » ce qu'on lui donne : ce n'est pas si simple.
Une étude de référence, publiée en 2024 dans une revue scientifique évaluée par les pairs, a mesuré comment les modèles utilisent un long contexte. Le résultat est net : leurs performances sont meilleures quand l'information utile se trouve tout au début ou tout à la fin de ce qu'on leur donne, et se dégradent nettement quand elle est enfouie au milieu — y compris pour les modèles conçus pour les longs contextes. Autrement dit, plus vous entassez de texte, plus le risque grandit que l'agent survole justement le passage qui comptait. Ne comptez pas sur lui pour retrouver, sans faute, une phrase noyée à la page 40 d'un document collé d'un bloc. La parade tient en trois gestes : placez l'essentiel en tête ou en fin, résumez avant de demander, et découpez les gros documents plutôt que de tout empiler.
Le deuxième piège concerne la mémoire persistante. Elle est pratique tant qu'elle est juste — mais rien ne garantit qu'elle le soit. Un agent peut mémoriser une information erronée (une préférence mal comprise, un fait déduit de travers) et la rejouer ensuite à chaque session comme si elle était vraie. La mémoire ne trie pas le vrai du faux : elle garde ce qu'elle a enregistré. Une erreur qui, sans mémoire, restait cantonnée à un échange devient alors un biais permanent. D'où un réflexe simple, trop rarement appliqué : comme pour un long document, il faut aller relire ce que l'agent a retenu. Les assistants grand public rendent d'ailleurs cette mémoire consultable et modifiable : ChatGPT liste ses souvenirs dans les réglages et permet de les supprimer ; Gemini expose un interrupteur et efface les souvenirs quand vous effacez les conversations d'origine ; Claude affiche ce qu'il a retenu et propose un mode sans mémoire. Prenez l'habitude d'ouvrir ce panneau et de corriger.
Ce que l'agent garde vous engage
Le troisième piège est le plus discret : une mémoire persistante retient des données personnelles. Ce que vous confiez à un agent au fil de l'eau — un nom de client, un montant, un dossier sensible — peut être conservé bien après l'échange, parfois à votre insu. Or dès qu'un système mémorise des données personnelles, il tombe sous le régime du RGPD. La CNIL le rappelle : minimisation (ne garder que le nécessaire) et conservation limitée dans le temps. Et vous disposez d'un levier concret : le droit à l'effacement (article 17 du RGPD), qui permet d'exiger la suppression de vos données — un droit que ces mémoires facilitent justement, puisqu'on peut les purger d'un clic.
- Distinguez l'éphémère du durable. Ce qui tient dans la session s'oublie à la fermeture ; ce qui passe en mémoire persistante reste. Sachez, à chaque fois, dans laquelle vous écrivez — et activez la mémoire persistante en connaissance de cause.
- Ancrez sur des sources plutôt que « de mémoire ». Pour tout ce qui doit être exact, faites travailler l'agent sur un document fourni et demandez-lui de citer le passage. Une réponse sourcée se vérifie ; un souvenir, non.
- Relisez et corrigez ce qu'il retient. Ouvrez régulièrement le panneau des souvenirs, supprimez les faux, précisez les approximations. Une mémoire non relue dérive en silence.
- Ne laissez rien de confidentiel s'installer. Données personnelles, dossiers clients, secrets : évitez de les confier à la mémoire d'un outil grand public, préférez un mode sans mémoire pour les échanges sensibles, et effacez ce qui n'a pas à rester.
Le droit accompagne ce mouvement. Le règlement européen sur l'IA impose, dès le 2 août 2026, d'informer les personnes lorsqu'elles interagissent avec une IA (article 50) — un principe de transparence qui vaut aussi quand un agent agit en s'appuyant sur ce qu'il a mémorisé de vous. Pour cadrer ces usages en interne, voir comment encadrer l'usage de l'IA dans votre entreprise et, en amont, à quels outils et données connecter un agent sans lui ouvrir toutes les portes.
Donner une mémoire à un agent, c'est un vrai gain : il gagne en continuité, cesse de vous faire tout répéter et retrouve vos documents. Mais la valeur vient de la maîtrise de cette mémoire, pas de son volume. Ancrez sur des sources, relisez ce qui est gardé, et n'y déposez rien que vous ne voudriez pas voir conservé.
- Trois mémoires, pas une : le contexte de session (éphémère), la mémoire persistante (durable, d'une session à l'autre), le rappel de vos sources (ancré sur des documents).
- La fenêtre oublie le milieu : l'info utile est mieux lue au début ou à la fin ; résumez, découpez, placez l'essentiel aux extrémités.
- La mémoire persistante se pollue : un souvenir faux est rejoué comme vrai — relisez et corrigez ce que l'agent retient.
- Elle retient du confidentiel : minimisation, conservation limitée, et droit à l'effacement (RGPD article 17) ; rien de sensible dans un outil grand public.
- Le cadre suit : transparence obligatoire dès le 2 août 2026 quand une IA interagit avec des personnes.
Dans la même série sur les agents : jusqu'où faire confiance à un agent IA, connecter un agent à vos outils, résumer un long document sans tout relire. Et côté fondamentaux : ce qui se passe sous le capot d'un modèle.
Cette analyse fait partie de notre veille Outils & IA. Pour donner une mémoire à vos agents sans tout leur laisser retenir, téléchargez l'Atlas IA 2026 et abonnez-vous à la newsletter AISKILLSPRO.
Au-delà de l'IA, retrouvez nos guides, tutoriels et modules Odoo sur OdooSkills, le blog Odoo ↗ (nouvel onglet).