Dans les équipes de services IT, la perte de contrôle figure parmi les préoccupations les plus fréquemment associées à l’adoption de l’intelligence artificielle. La crainte est simple : qu’un système automatisé prenne une mauvaise décision opérationnelle sans que personne ne puisse l’identifier à temps.
Cette inquiétude est légitime. La réponse n’est toutefois pas de renoncer à l’automatisation, mais de l’introduire progressivement, dans un cadre maîtrisé et gouverné. C’est précisément le rôle du confidence scoring en ITSM : un mécanisme qui mesure le niveau de certitude d’une IA concernant une recommandation ou une décision, puis détermine, en fonction de ce niveau de confiance, si l’action peut être exécutée automatiquement ou si elle doit être validée par un opérateur humain.
Qu’est-ce que le confidence scoring ?
Chaque fois qu’un modèle d’intelligence artificielle produit un résultat (attribution d’une catégorie à un ticket, routage vers une équipe de support, recommandation d’un article de base de connaissances), il peut associer à cette proposition une valeur numérique représentant son niveau estimé de fiabilité. Cette valeur constitue le score de confiance (confidence score).
Un score élevé indique que le modèle considère sa recommandation comme particulièrement fiable, tandis qu’un score faible révèle une incertitude plus importante. Le confidence scoring en ITSM permet alors de définir des seuils de confiance et d’associer chacun d’eux à une action précise : au-dessus du seuil défini, l’IA agit de manière autonome et en dessous du seuil, la décision est soumise à une validation humaine.
Cette logique de routage fondée sur des seuils est aujourd’hui l’un des modèles de gouvernance de l’IA les plus répandus dans les entreprises. Les décisions jugées suffisamment fiables sont exécutées automatiquement, tandis que les cas plus incertains sont orientés vers un opérateur humain.
Cette approche s’inscrit dans le modèle dit Human-in-the-Loop, qui maintient l’intervention humaine au sein du processus décisionnel automatisé. L’objectif n’est pas d’éliminer l’humain, mais de concentrer son expertise là où elle apporte le plus de valeur.
La supervision humaine reste une priorité
Le fait que les organisations privilégient encore un certain niveau de contrôle humain est confirmé par les données recueillies par EasyVista auprès de son Customer Advisory Board.
Plus de 80 % des répondants déclarent souhaiter un niveau de supervision humaine allant de modéré à élevé sur les décisions prises par l’IA. Cette proportion atteint 80 % en Amérique du Nord et 87 % dans la région EMEA. À l’inverse, seule une minorité se dit prête à confier des décisions à l’IA avec peu, voire aucune supervision humaine.
L’étude révèle également que l’adhésion à l’IA est nettement plus forte pour les usages d’assistance aux opérateurs : génération de résumés de tickets, analyse guidée des incidents, suggestions de réponses automatisées. En revanche, les cas d’usage impliquant davantage d’autonomie, comme la classification automatique de la qualité des données CMDB ou l’escalade intelligente des incidents, recueillent des niveaux d’acceptation sensiblement plus faibles.
De la prudence à l’obligation : les exigences du règlement sur l’intelligence artificielle (AI Act)
Cette volonté de conserver un contrôle humain ne relève plus uniquement d’une préférence organisationnelle. Elle devient progressivement une exigence réglementaire. L’article 14 de l’AI Act européen prévoit que les systèmes d’intelligence artificielle à haut risque soient conçus de manière à permettre une supervision humaine effective.
Le confidence scoring constitue précisément le mécanisme technique qui transforme ce principe réglementaire en pratique opérationnelle. Plutôt que d’imposer à un opérateur de vérifier manuellement chaque décision prise par l’IA, une approche irréaliste lorsqu’il faut traiter des milliers de tickets chaque jour, il concentre l’attention humaine sur les situations réellement sensibles, c’est-à-dire celles pour lesquelles le modèle lui-même exprime un niveau de certitude plus faible. La supervision devient ainsi sélective, ciblée et documentable.
Le confidence scoring en ITSM : de la définition des seuils à la validation humaine
La véritable valeur du confidence scoring réside dans sa capacité à être configuré selon le niveau de risque associé à chaque décision. Toutes les actions n’ont pas les mêmes conséquences. Le seuil de confiance ne doit donc pas être défini en fonction de la précision moyenne du modèle, mais du coût potentiel d’une erreur.
Parmi les applications les plus matures de l’IA en ITSM figurent la catégorisation et le routage automatiques des incidents. Le modèle analyse la demande, détermine son niveau d’urgence et l’oriente vers l’équipe la plus appropriée. C’est précisément dans ce contexte que les seuils de confiance prennent tout leur sens.
Pour la catégorisation automatique des tickets, une tâche répétitive, à faible impact et facilement réversible, une organisation peut accepter un seuil relativement bas. Si l’IA estime sa prédiction fiable à 90 %, la catégorie peut être appliquée sans intervention humaine. En revanche, lorsqu’il s’agit d’une action plus sensible, comme le déclenchement automatique d’une procédure de changement affectant un système en production, le seuil devra être nettement plus élevé. Dans certains cas, une validation humaine restera obligatoire, quel que soit le score de confiance obtenu.
Des seuils différents selon le niveau de risque
Ce principe s’étend bien au-delà de la simple catégorisation. Prenons l’exemple d’une suggestion automatique d’article de base de connaissances destinée à un technicien qui traite un ticket. Si l’IA affiche un niveau de confiance élevé, l’article peut être mis en avant directement dans l’interface. Le risque étant faible, l’opérateur conserve simplement la décision finale.
La situation est différente lorsqu’une réponse générée par l’IA est envoyée automatiquement à l’utilisateur final. Une erreur aurait alors un impact immédiat sur l’expérience de la personne ayant soumis la demande. Dans ce cas, le seuil de confiance exigé sera beaucoup plus élevé et une validation humaine préalable restera souvent nécessaire.
Le facteur déterminant n’est donc jamais la complexité technique de la tâche, mais le coût potentiel d’une erreur.
Le document stratégique publié par le Customer Advisory Board d’EasyVista décrit cette approche sous le concept de Human-Governed Automation. Des seuils explicites de tolérance à l’autonomie sont définis, tandis que le confidence scoring alimente des workflows d’approbation conditionnelle. Dans ce modèle, la revue humaine n’est pas considérée comme un frein à l’automatisation, mais comme un mécanisme d’apprentissage. Chaque correction apportée par un opérateur constitue un signal qui permet d’améliorer progressivement le modèle.
Un cercle vertueux se met alors en place : l’IA formule une proposition, l’opérateur la valide ou la corrige, le modèle apprend de cette interaction.
Un indicateur stratégique pour décider de ce qu’il faut automatiser demain
Le confidence scoring offre un second avantage, souvent sous-estimé : il permet d’identifier les processus pouvant être automatisés de manière plus ambitieuse. Lorsqu’un workflow génère systématiquement des scores élevés et que les validations humaines confirment régulièrement les propositions de l’IA, cela indique que ce processus est un candidat naturel à une autonomie accrue. À l’inverse, lorsqu’un processus continue de produire des scores faibles ou nécessite de nombreuses corrections humaines, cela révèle que les conditions ne sont pas encore réunies pour augmenter le niveau d’automatisation.
Cette logique d’expansion progressive est au cœur de l’approche défendue par EasyVista : commencer par des mécanismes d’assistance et d’automatisation fortement encadrés dans le cadre du travail IT réel, puis élargir progressivement le champ d’autonomie à mesure que les résultats démontrent leur fiabilité.
C’est le principe de l’autonomie adaptative (adaptive autonomy). Les agents d’IA qui maintiennent un niveau de performance élevé sur la durée gagnent progressivement davantage d’autonomie, tandis que ceux dont les performances se dégradent reviennent sous un contrôle humain renforcé. Le confidence scoring fournit alors les données objectives nécessaires pour prendre ces décisions, en les fondant sur des preuves plutôt que sur des intuitions.
Les limites du confidence scoring : pourquoi le score de confiance ne suffit pas à lui seul
Il serait néanmoins une erreur de considérer un score de confiance comme une vérité absolue.
Un modèle peut afficher un niveau de confiance élevé tout en produisant une réponse incorrecte. Une forte confiance ne garantit pas nécessairement l’exactitude.
C’est pourquoi les architectures d’IA les plus robustes ne reposent jamais sur un indicateur unique. Elles combinent généralement plusieurs signaux en plus du score de confiance : indicateurs de fiabilité globale, alertes de risque spécifiques.
Cette approche permet d’identifier les situations dans lesquelles un modèle accorde une confiance excessive à une réponse erronée. Dans le contexte ITSM, cela se traduit par une règle simple : les seuils de confiance doivent toujours être complétés par des contrôles métiers adaptés au contexte.
Une décision présentant un impact financier, réglementaire ou opérationnel important devrait systématiquement faire l’objet d’une validation humaine, indépendamment du score attribué par l’IA. Le confidence scoring ne remplace donc pas le jugement humain. Il permet simplement de l’orienter là où il est réellement nécessaire.
Contrôle et confiance progressent ensemble
Le confidence scoring en ITSM est à la fois un principe de gouvernance et un mécanisme opérationnel qui rend l’adoption de l’IA durable et maîtrisable. Il permet aux organisations de démarrer avec un niveau de contrôle élevé, d’étendre progressivement l’autonomie lorsque les résultats le justifient et de garantir qu’un humain puisse intervenir sur les décisions les plus sensibles.
C’est ainsi que l’intelligence artificielle passe du stade de projet pilote nécessitant une surveillance constante à celui d’un levier d’automatisation auquel les équipes peuvent véritablement faire confiance. Les organisations qui adoptent cette approche ne renoncent pas à la rapidité et à l’efficacité de l’IA. Elles les obtiennent sans sacrifier le contrôle, en construisant la confiance progressivement, workflow après workflow.
FAQs
1. Qu’est-ce que le confidence scoring en ITSM ?
Le confidence scoring est un mécanisme qui attribue un score de fiabilité à chaque recommandation ou décision produite par une intelligence artificielle. Ce score est comparé à des seuils prédéfinis : au-dessus du seuil, l’IA agit de manière autonome ; en dessous, la décision est soumise à une validation humaine. Cette approche permet d’adopter l’IA progressivement tout en conservant la maîtrise opérationnelle.
2. Pourquoi est-il important de maintenir une intervention humaine dans le processus décisionnel ?
L’intelligence artificielle peut commettre des erreurs, et certaines décisions IT peuvent avoir des conséquences opérationnelles, financières ou réglementaires significatives. Plus de 80 % des organisations interrogées par EasyVista déclarent préférer un niveau de contrôle humain modéré à élevé. Par ailleurs, l’AI Act européen impose une supervision humaine effective pour certains systèmes à haut risque.
3. Comment définir le bon seuil de confiance ?
Le seuil doit être déterminé en fonction du coût potentiel d’une erreur et non de la précision moyenne du modèle. Les tâches répétitives, à faible impact et facilement réversibles, comme la catégorisation de tickets, peuvent tolérer des seuils plus faibles. Les actions critiques, en revanche, nécessitent des seuils plus élevés ou une validation humaine systématique.
4. Le confidence scoring sert-il uniquement à contrôler l’IA ?
Non. Utilisé dans la durée, il constitue également un excellent indicateur de maturité de l’automatisation. Les workflows qui génèrent régulièrement des scores élevés et nécessitent peu de corrections humaines peuvent progressivement bénéficier d’une autonomie accrue, tandis que les processus plus incertains continuent d’être supervisés