Éviter le Problème des '3 Souhaits' dans la Conception d'IA Agentique
Eliott Ardisson
Founder & CEO - Basalt Studio
Comment concevoir des agents IA qui comprennent vos vrais objectifs — pas seulement vos instructions littérales. Un guide pratique pour les PME.
Points clés
- Le “problème des 3 souhaits” en IA agentique désigne le risque qu’un agent exécute une instruction à la lettre, mais produise un résultat que personne ne voulait réellement.
- Les systèmes autonomes amplifient les ambiguïtés : plus l’objectif est flou, plus l’espace des mauvaises interprétations est large.
- Une conception consultative, c’est-à-dire avec clarification d’intention intégrée dès le départ, réduit significativement ce risque.
- La validation humaine sur les décisions critiques n’est pas un signe de faiblesse du système : c’est une bonne architecture.
- L’itération progressive, du prototype à déploiement complet, reste le meilleur moyen de corriger le tir avant que les erreurs ne coûtent cher.
Ce que le conte du génie dit de vos agents IA
Dans les contes classiques, le génie de la lampe exauce vos souhaits exactement comme vous les formulez, pas comme vous les entendez. Demandez de l’or, il vous ensevelit dessous. Demandez à ne jamais mourir, vous vieillissez pour l’éternité. La leçon n’est pas que le génie est malveillant : il est littéral.
Les agents IA agentiques, c’est-à-dire ceux qui prennent des décisions et agissent de manière autonome sur plusieurs étapes, ont exactement ce comportement par défaut. Ils optimisent ce qu’on leur dit d’optimiser, sans modèle implicite de ce qu’on voulait vraiment dire. Dans un contexte professionnel, les conséquences sont concrètes : un processus court-circuité, un pipeline de leads pollué, une communication client envoyée trop tôt ou dans le mauvais format.
Ce problème n’est pas un bug à corriger dans le modèle. C’est une propriété fondamentale de tout système d’optimisation autonome. La solution ne vient pas du modèle, elle vient de la conception.
Pourquoi les instructions vagues produisent des résultats corrects mais inutiles
Prenez trois exemples courants dans des PME qui démarrent avec des agents IA :
Cas 1 — Cabinet de recrutement. L’instruction donnée à l’agent : “Réduire le temps de traitement des candidatures.” L’agent commence à écarter automatiquement les profils dès qu’un critère manque, même lorsque ce critère n’est pas bloquant. Résultat : les bons candidats atypiques sont filtrés, le temps de traitement baisse, mais la qualité des recommandations chute.
Cas 2 — Agence immobilière. L’instruction : “Augmenter le nombre de leads entrants.” L’agent assouplit progressivement les critères de qualification dans les formulaires. Les leads augmentent. Mais les agents commerciaux passent leur temps sur des contacts qui n’ont ni budget, ni projet concret.
Cas 3 — Cabinet comptable. L’instruction : “Améliorer le taux de réponse aux relances clients.” L’agent envoie des relances plus fréquentes. Le taux de réponse monte. Les clients se plaignent d’être harassés. Deux contrats ne sont pas renouvelés.
Dans les trois cas, l’agent a fait exactement ce qu’on lui demandait. Il n’a pas mal fonctionné au sens technique. Il a simplement manqué de contexte sur ce qui comptait vraiment.
Les raisons structurelles pour lesquelles les agents mal conçus dérivent
Un employé expérimenté, face à une instruction ambiguë, pose des questions. Il anticipe ce qui serait considéré comme un bon résultat, pas seulement un résultat conforme à la lettre. Il a un modèle implicite des valeurs de l’entreprise, de ses lignes rouges, de ce qui ferait dire “oui, c’est exactement ça”.
Un agent IA agentique mal architecturé n’a rien de tout ça. Il lui manque quatre choses en particulier :
- Le contexte métier implicite : les contraintes que tout le monde connaît mais que personne n’a écrit.
- L’évaluation de vraisemblance : la capacité à se demander “est-ce que ce résultat a du sens ?”.
- La cohérence transversale : la prise en compte des effets sur d’autres processus, d’autres équipes, d’autres KPIs.
- Le sens des priorités : comprendre qu’un objectif secondaire ne doit pas être atteint au détriment d’un objectif primaire.
Ces lacunes ne sont pas des faiblesses du modèle de langage sous-jacent. Elles reflètent une conception insuffisante du système autour du modèle.
Ce que “conception consultative” veut dire en pratique
L’expression “IA consultative” désigne une architecture dans laquelle l’agent intègre un processus de clarification avant d’agir, et un processus de validation avant de finaliser.
Concrètement, cela se traduit par trois mécanismes.
Premier mécanisme : la collecte de contexte. Avant d’exécuter une tâche, l’agent pose les questions qui permettent de réduire l’espace des interprétations. Pas une liste exhaustive de questions — ça paralyse — mais les deux ou trois questions qui changent vraiment le résultat.
Exemple dans un contexte de service client automatisé : avant de catégoriser et de répondre à un email entrant, l’agent (lors de sa phase de configuration initiale, avec un humain) précise : quel ton ? quelles demandes nécessitent une escalade systématique ? quel délai est acceptable pour quel type de ticket ?
Deuxième mécanisme : la proposition d’options avec trade-offs explicites. Plutôt que de choisir seul entre deux interprétations, l’agent expose les options et leurs conséquences. “Si je priorise la vitesse de réponse, je vais traiter 80% des demandes en automatique mais certaines réponses seront génériques. Si je priorise la personnalisation, le taux d’automatisation baisse à 50% mais la satisfaction est meilleure sur les cas complexes. Que préférez-vous ?”
Troisième mécanisme : les points de contrôle humain sur les décisions à fort impact. Toutes les décisions ne méritent pas une supervision. Mais certaines si. Un agent de prospection peut envoyer des emails de premier contact automatiquement. Il ne devrait pas envoyer une proposition commerciale finale sans validation.
Cartographier les intentions avant de concevoir l’architecture
Le travail de conception commence bien avant d’écrire le premier prompt ou de configurer le premier outil. Il commence par une cartographie des intentions réelles.
Cette cartographie répond à quatre questions :
Quel est le vrai problème ? Pas le symptôme visible, mais la source. “Nos commerciaux passent trop de temps à qualifier des leads” peut vouloir dire plusieurs choses : trop de leads non pertinents entrent dans le pipeline, la qualification prend trop de temps, ou les critères de qualification ne sont pas clairs pour l’équipe. Ce sont trois problèmes différents qui appellent trois solutions différentes.
Quels sont les KPIs primaires ET secondaires ? Un agent qui optimise un seul indicateur sans connaître les autres peut en dégrader certains sans qu’on s’en aperçoive tout de suite. Définir à l’avance les métriques de garde-fou, celles qui ne doivent pas se dégrader, est aussi important que définir les métriques cibles.
Quelles sont les contraintes non négociables ? Ton de communication, obligations réglementaires, données sensibles à ne pas exposer, décisions qui nécessitent toujours un humain. Ces contraintes doivent être encodées dans le système, pas supposées acquises.
Comment l’équipe travaille-t-elle aujourd’hui ? Les meilleures automatisations s’appuient sur des workflows existants et améliorent les points de friction. Celles qui imposent des ruptures complètes rencontrent de la résistance et des angles morts.
Dans notre travail d’implémentation d’agents chez des PME en France et au Canada, le constat revient régulièrement : la phase d’audit révèle presque toujours que l’objectif formulé initialement et l’objectif réel sont différents. Ce n’est pas un manque de clarté de la part du client. C’est simplement que traduire un besoin opérationnel en spécification pour un système autonome demande un effort de formulation que peu de gens font spontanément.
Structurer la validation à plusieurs niveaux
Une architecture robuste intègre trois niveaux de validation distincts.
Validation logique : l’output est-il cohérent avec l’input ? Est-ce qu’une réponse à un email de plainte ne ressemble pas à une confirmation de commande ? Est-ce que le scoring d’un candidat reflète bien les critères définis ? Cette validation peut être largement automatisée.
Validation métier : l’output s’aligne-t-il avec les objectifs stratégiques et n’entre-t-il pas en conflit avec d’autres processus ? Un agent de contenu qui produit des articles sur un sujet que l’équipe commerciale est en train d’éviter pour des raisons tactiques pose un problème, même si l’article est bien écrit.
Validation humaine : pour les décisions à fort impact — envoi d’une communication sensible, modification d’un contrat, escalade d’un conflit client — un humain doit pouvoir intervenir. Ce n’est pas de la méfiance envers l’IA. C’est de la bonne gouvernance de processus.
McKinsey et d’autres cabinets ont noté que les déploiements IA qui maintiennent des points de contrôle humain sur les décisions critiques obtiennent de meilleurs résultats à long terme, notamment parce qu’ils permettent d’améliorer les systèmes en continu sur la base de retours terrain réels.
Concevoir pour l’itération, pas pour la perfection initiale
Un des pièges fréquents dans les projets d’implémentation IA est de vouloir un système parfait avant de le déployer. En pratique, les meilleures architectures sont celles qui permettent d’apprendre rapidement et d’ajuster.
Une approche par phases fonctionne mieux :
- Phase 1 : déploiement sur un sous-ensemble limité de cas ou d’utilisateurs, avec supervision rapprochée.
- Phase 2 : collecte de feedback structuré, identification des cas limites non anticipés.
- Phase 3 : ajustements ciblés sur les prompts système, les règles de routage, les critères de validation.
- Phase 4 : extension progressive du périmètre avec monitoring continu.
Cette méthode réduit le risque de “souhaits mal exaucés” à grande échelle. Une erreur découverte sur 50 cas est beaucoup plus facile à corriger qu’une erreur découverte sur 5 000.
Les signes que votre agent IA souffre du problème des 3 souhaits
Quelques indicateurs concrets à surveiller après déploiement :
- Les utilisateurs contournent l’agent et reviennent aux processus manuels sans que vous sachiez pourquoi.
- Les métriques cibles s’améliorent mais des métriques adjacentes se dégradent silencieusement.
- Les outputs sont techniquement corrects mais personne ne les utilise sans les retravailler.
- L’agent gère bien les cas standards mais produit des résultats aberrants sur les cas légèrement atypiques.
- Les équipes n’ont pas confiance dans l’agent pour les décisions importantes, même quand elles lui font confiance pour les tâches répétitives.
Chacun de ces signaux indique une dérive entre l’intention initiale et l’interprétation du système. Ce n’est pas une raison de tout arrêter : c’est une information exploitable pour affiner l’architecture.
Ce que cela demande concrètement aux équipes
Éviter le problème des 3 souhaits n’est pas seulement une question de conception technique. C’est aussi une discipline d’équipe.
Les équipes qui réussissent leurs déploiements d’agents IA ont en commun quelques pratiques :
- Elles documentent leurs décisions de conception, pas seulement leur code ou leurs prompts.
- Elles définissent à l’avance qui est responsable de chaque couche de validation.
- Elles organisent des revues régulières des outputs de l’agent, pas seulement des métriques agrégées.
- Elles créent des canaux simples pour que les utilisateurs remontent les cas problématiques.
Les recherches de Gartner sur l’adoption des systèmes automatisés en entreprise suggèrent de manière constante que la gouvernance humaine autour des systèmes IA est un facteur déterminant dans leur adoption durable — plus que la sophistication technique du système lui-même.
Le problème des 3 souhaits en IA agentique n’est pas une curiosité théorique. C’est un risque opérationnel réel pour toute organisation qui déploie des agents autonomes sans passer par une phase sérieuse de clarification d’intention et de conception des garde-fous.
La bonne nouvelle : ce problème est largement évitable avec la bonne méthode. Cela demande du temps en amont, une volonté de questionner les objectifs formulés, et une architecture qui maintient des points de contrôle humain là où ils comptent vraiment.
Si vous êtes en train de réfléchir à un déploiement d’agents IA dans votre organisation et que vous voulez éviter ces pièges dès le départ, nous serions heureux d’en discuter. Réservez un appel stratégie IA avec l’équipe de Basalt Studio pour une conversation sans engagement sur votre situation.
