Qu’évaluons-nous lorsque nous parlons d’évaluation de la formation ? Est-ce la mémoire des connaissances, l’habileté à appliquer une compétence ou l’adaptabilité d’un talent à un environnement non anticipé ? Depuis les sophistes, jusqu’aux grandes batteries de tests standardisés, chaque outil d’évaluation incarne un paradigme différent, mais l’évaluation n’est toujours que le reflet d’une certaine vision du savoir. Avec le numérique et l’intelligence artificielle, un paradigme nouveau émerge dans l’évaluation avec une promesse de standardisation nouvelle. L’évaluation, est-elle encore l’affaire des experts qui définissent des référentiels ou des algorithmes qui nous suivent à la trace ? Qu’est-ce qui se joue dans cette évolution ? S’agit-il comme on nous l’annonce d’une révolution de l’évaluation la formation ? De quoi s’agit-il concrètement ?
1, La fin de l’évaluation classique
La formation contemporaine s’est construite sur l’évaluation de ce que dit l’expert. C’est l’ère des référentiels. L’évaluation dans sa forme référentielle a commencé avec la création des diplômes d’Etats ainsi que les concours administratifs dans la fonction publique, l’ensemble était décidé par arrêté ministériel. Le CAP, par exemple, fut créé avec la loi Astier en 1911 pour structurer la formation des jeunes dans des métiers qualifiés. Cette façon de penser trouve un aboutissement avec la loi de modernisation sociale (17 octobre 2002) qui crée officiellement le Répertoire National des Certifications Professionnelles, RNCP, outil officiel pour recenser les diplômes, les titres professionnels et les certificats de qualifications reconnus par l’Etat. En 2025, le RNCP regroupe 2 129 diplômes, titres, certificats. En 2002, il y en avait que 800. L’Europe rajoute une couche avec le Cadre Européen des Certifications (2008) et aujourd’hui l’Union des compétences.
Ces outils ont joué un rôle fondamental, ils ont permis d’asseoir la crédibilité des diplômes, de structurer des parcours professionnels et de donner une légitimité sociale et économique aux compétences ainsi validées. Ils ont également contribué à uniformiser les standards de qualification entre les secteurs, facilitant la mobilité professionnelle. Mais aujourd’hui, les savoirs deviennent évanescents. Selon un rapport de l’OCDE, « Stratégie 2019 sur les compétences », qui date de 6 ans, la durée de vie moyenne d’une compétence technique n’excéderait pas 2 ans, ce qui bouleverse le fonctionnement traditionnel de la formation. Le sociologue allemand Hartmut Rosa décrit ce phénomène comme une accélération sociale, « dans les sociétés modernes, la stabilité devient l’exception et l’accélération la règle » (Accélération, une critique sociale de temps, 2010). Les référentiels fixes perdent de leurs pertinences, faute de pouvoir s’adapter à temps. L’évaluation fondée sur ces référentiels n’évalue qu’une réalité qui n’existe déjà plus, un simulacre d’évaluation dirait Jean Baudrillard.
Pour répondre à cette volatilité, de nouvelles techniques ont vu le jour pour adapter le paradigme classique de l’évaluation. Par exemple, LinkedIn Learning intègre des algorithmes d’actualisation des référentiels en fonction des compétences recherchés sur le marché de l’emploi. Le référentiel devient dynamique. Seule l’intelligence artificielle peut traiter en temps réel les offres d’emplois, les descriptifs de poste ou les tendances sectorielles pour mettre à jour les référentiels. La formation s’accélère intégrant dans son programme les nouvelles compétences en temps réel. Par exemple, une formation de formateur dopée à l’IA intégrera des nouvelles compétences comme la synergologie ou la co-formation avec une l’IA. L’ensemble de ses référentiels ne sont que daté et sujet à modification permanente pour répondre aux modifications permanentes de la société. Le changement d’un référentiel statique vers un référentiel dynamique, voir prédictif, fait de l’évaluation un objet dynamique, voire prédictif.
2, L’évaluation algorithmique
L’IA a ouvert de nouveaux horizons. George Siemens et Phil Long proposent la voie au « learning analytics ». « Le learning analytics est la mesure, la collecte, l’analyse et la restitution de données concernant les apprenants et leurs contextes, dans le but de comprendre et d’optimiser l’apprentissage ainsi que les environnements dans lesquels il se déroule » (Learning analytics, 2011). Chaque clic, chaque pause, chaque retour en arrière devient une data qui est analysée avec l’idée de transformer ces traces numériques en indicateur de performance. L’analyse des traces numériques, learning datas fait passer l’évaluation sommatique, traduite de l’anglais summative, pour évaluer une qualité à sa phase finale, fait place à une évaluation continue algorithmique.
Le numérique va plus loin, il propose des avancées. Par exemple, les soft skills longtemps jugées inévaluables, ou seulement par le déclaratif des apprenants, entre désormais sous le radar numérique. Dès 2004, HireVue proposait d’utiliser l’IA pour analyser les micro-expressions faciales, les choix lexicaux, la fluidité du discours qui grâce à un scoring des compétences comportementales permet l’usage de métriques exploitables. D’autres proposent des modèles d’analyse IA de la voix, de la gestuelle ou des micro-signaux des apprenants permettant ainsi l’évaluation en temps réel de l’apprenant. Mieux l’IA peut anticiper des comportements comme la capacité au leadership ou de prédire un décrochage de l’apprenant et adapter la formation en fonction. L’IoT augmente encore le nombre de capteurs pour évaluer encore plus précisément les soft skills, ou hard skills. L’IA repousse les frontières de l’évaluation.
Cela n’est pas sans poser un certain nombre de questions. La frontière entre évaluation et surveillance peut facilement devenir poreuse. L’évaluation au lieu de libérer peut devenir un enfermement. Mark Andrejevic parle de « digital enclosure » où l’apprenant court le risque d’être enfermé dans un univers prédictif qui anticipe ses comportements et réduit ses marges de liberté. « L’enfermement numérique n’est pas seulement un contrôle des données, mais un encadrement de l’expérience même des individus » (Infoglut, how to much information is changing the way we think and know, 2013). La « clôture numérique » ne se limite pas à l’encadrement des comportements, mais aussi celui des horizons d’actions possibles, limitant pour des raisons statistiques la capacité des individus à apprendre autre chose, autrement. Le danger orwellien du traitement de la learning data n’est pas neutre.
3, Une autre gouvernance
Dans le modèle classique, l’expert évaluateur incarnait l’autorité et définissait les critères à partir de normes professionnelles que ses pairs avaient eux-mêmes créées, l’ère des experts. L’IA fragilise cette centralité : non seulement les référentiels sont générés automatiquement à partir de l’analyse massive des datas, mais les évaluations, elles-mêmes, sont générées par l’IA, évaluer par des algorithmes, qui ne sont jamais neutre comme l’explique Ben Williamson (Big data in education, 2017). Il s’agit d’un changement de paradigme, le passage d’un modèle hiérarchique fondé sur l’expert à un modèle algorithmique fondé sur sa capacité à traiter et à prédire l’information en masse et en temps réel. « Les algorithmes ne sont pas seulement des solutions techniques, mais des institutions qui organisent le flux d’information et d’attention » (Tarleton Gillespie, The relevance of algorithms, 2014). La société se trouve dans la possibilité de préserver des institutions formatives verticalisées, mais algorithmiques.
D’autres alternatives d’évaluation sont possibles comme les systèmes d’évaluation horizontalisés. Il s’agit de sortir de l’expertise pour entrer dans le monde de l’apprenant, remettre l’apprenant au centre de la formation et de son évaluation. L’apprenant devient son propre évaluateur. « Les adultes apprennent mieux lorsqu’ils perçoivent eux-mêmes la nécessité de savoir et lorsqu’ils participent à la définition de leurs objectifs d’apprentissage » (Malcom Knowles, The adult learner, 1984). On parle de peer assessment. Gary Wolf fondateur du mouvement Quantified self avait cette belle formule « la connaissance de soi par les nombres ». L’accumulation et l’analyse de la learning data devient un levier de réflexivité et d’apprentissage. L’auto-évaluation permet à l’apprenant de construire une nouvelle autonomie.
La question qui doit être socialement posée à la politique d’évaluation est : faut-il chercher à contrôler ou a faire confiance ? La preuve de la performance ou de la conformité avec la multiplication des contrôles, doit-elle laisser la place à la confiance dans l’apprenant qui est au fond le meilleur juge de ce qu’il a appris ? La pairagogie propose une solution intermédiaire, l’évaluation peut se faire par la communauté de pairs, un processus collectif de reconnaissance co-construit entre les apprenants. C’est tout l’enjeu des open badges imaginé à son origine par la Fondation Mozilla en 2012. L’apprenant peut badger, certifier ses propres compétences et les socialiser via les réseaux sociaux. Mieux, il peut faire école, d’autres peuvent endosser son badge. Il s’agit d’une modalité d’évaluation par la base. La question est bien celle de la confiance que la société veut bien accorder à l’apprenant.
L’évaluation fut longtemps un rituel d’institution, la note, la performance déterminait le devenir de l’apprenant. Aujourd’hui, sous l’influence des modèles anglo-saxons, repris par l’Union européenne, la note est remplacée par la trace. L’apprenant est suivi dans son parcours, ses données deviennent des preuves de progression. L’IA vient bousculer cette alternative en proposant un système qui peut être complètement décentralisé qui non seulement trace l’apprenant dans son parcours d’apprentissage, mais lui redonne la main en l’accompagnant personnellement pour qu’il améliore ses métriques. Cela redonne des couleurs à la notion d’autonomie rousseauiste. Autonomie, étymologiquement, qui se régit par ses propres lois. La question sociale que cela pose est : à qui appartient l’évaluation ? La question de l’évaluation est une question qui réinterroge l’ensemble de l’organisation de la formation. On pourrait rappeler que la formation, apprentissage socialisé, sert à faire société, encore faut-il s’entendre sur la société que l’on veut construire. Jusqu’où peut-on faire confiance à un apprenant, même adulte ?
Fait à Paris, le 07 octobre 2025
@StephaneDIEB pour vos commentaires sur X