Docimologie

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La docimologie, l'étude des épreuves, est la discipline scientifique consacrée à l'étude du déroulement des évaluations en pédagogie[1] et notamment à la façon dont sont attribuées les notes par les correcteurs des examens scolaires.

Historique[modifier | modifier le code]

En 1922, Henri Piéron introduit le terme de docimologie pour désigner la science et la pratique du contrôle des connaissances ; il le définira en 1951 par « l’étude systématique des examens (modes de notation, variabilité interindividuelle et intra-individuelle des examinateurs, facteurs subjectifs, etc.) ». Avec sa femme et Henri Laugier, il pose les fondements de cette nouvelle discipline avec l'« Étude critique de la valeur sélective du certificat d'études et comparaison de cet examen avec une épreuve par tests. Contribution à une docimastique rationnelle », présentée lors de la IVe conférence internationale de psychotechnique. Inspirée par la psychologie expérimentale et la physiologie, la docimologie apparait dans le sillage du mouvement de l'éducation nouvelle qui vise à refonder l'enseignement sur la méthode scientifique, remettant en cause les schémas traditionnels[2].

Cadre théorique[modifier | modifier le code]

La note : sous l'influence de multiples facteurs[modifier | modifier le code]

L'objectif de la docimologie est d'abord de rechercher les facteurs qui entrent en jeu dans l'évaluation qui sera faite d'un travail écrit ou oral fourni par un élève, indépendamment de la valeur intrinsèque de ce travail ou de l'élève en question.

Une méthode de choix consiste donc à travailler ceteris paribus, c'est-à-dire, en observant la variabilité des notes obtenues pour une même copie soumise à différents évaluateurs ou évaluée dans différentes conditions ou encore pour un élève donné. Plusieurs types de facteurs sont donc supposés intervenir. On peut distinguer les facteurs ayant trait :

  • à l'évaluateur ;
  • aux conditions de l'évaluation ;
  • à la nature de l'énoncé.

Facteurs liés à l'évaluateur[modifier | modifier le code]

Face à une copie, l'évaluateur peut avoir des préjugés, être influencé par son humeur ou l'état d'esprit dans lequel il se trouve (degré de concentration, fatigue), etc. Son jugement sur ce qu'il doit évaluer peut être biaisé par ces éléments.

Cela pose notamment le problème de l'évaluation continue et, de manière générale, des situations dans lesquelles l'évaluateur et le formateur ne font qu'un :

  • d'un côté, le formateur connaît l'élève et est donc capable de faire la part des choses, par exemple, entre une mauvaise performance accidentelle et une lacune réelle, ou bien de prendre en compte certaines compétences de l'élève pour ajuster son avis ;
  • d'un autre côté, l'évaluation subit un biais dû aux a priori de l'évaluateur.

Les conditions de l'évaluation[modifier | modifier le code]

Différents facteurs liés aux conditions dans lesquelles s'effectuent l'évaluation peuvent aussi influer sur le résultat final. Certains sont les manifestations particulières de phénomènes plus généraux de ce qu'on appelle des biais, dont certains ont été étudiés en détail par la psychologie sociale et cognitive.

  • Effet de halo : si un élève est présenté comme brillant, sa copie pourrait être mieux notée que s'il était présenté comme médiocre ;
  • Effet de contraste ou d'ancrage : une copie moyenne sera surévaluée quand elle sera corrigée après plusieurs mauvaises copies et, inversement, elle sera sous-évaluée après plusieurs bonnes copies.

Influence de l'énoncé[modifier | modifier le code]

La manière de poser la question — au sens large, de présenter le problème servant à l'évaluation — influe sur la réponse : on parle du biais induit par la question. Ce phénomène a été étudié en psychologie cognitive.

L'énoncé peut aussi induire en erreur :

  • il peut comporter des erreurs (ce qui doit bien sûr être évité) : comment alors évaluer la réponse à une question erronée ? Cette situation peut également être voulue, par exemple pour tester la réactivité du candidat, sa capacité à prendre du recul, à douter de l'autorité ;
  • l'énoncé peut être inadapté à la formation : d'un niveau trop simple ou, au contraire, trop élevé, ou bien présentant une situation que l'apprenant ne peut pas gérer car les connaissances, savoir-faire ou savoir-être nécessaires ne font pas partie des pré-requis de l'examen.

Questions de base sur l'évaluation[modifier | modifier le code]

Lorsque l'on conçoit une évaluation, il convient de se poser six questions :

  • pourquoi évaluer ? Voir « Buts de l'évaluation » ci-après ;
  • pour qui évaluer ? Pour l'apprenant, pour le commanditaire de la formation, pour le futur employeur, etc. ?
  • comment évaluer ?
  • qui évaluer ? L'apprenant, le formateur, la formation, etc. ?
  • quoi évaluer ?
  • quand évaluer ?

Buts de l'évaluation[modifier | modifier le code]

Il convient d'abord de se poser la question du pourquoi de l'évaluation.

L'évaluation est d'abord un moyen de suivre les progrès : une formation a des objectifs à atteindre, en termes de transmission de savoirs (connaissances), savoir-faire (pratiques), savoir-être (attitudes), l'évaluation permet donc de situer les apprenants vis-à-vis de ces objectifs. Cela permet de motiver les apprenants, de leur faire prendre conscience qu'ils ont besoin de fournir un effort, de leur montrer qu'ils se sont améliorés, mais cela permet aussi au formateur de se remettre en question, d'adapter la formation (forme et contenu).

L'évaluation est ensuite un moyen de certifier que les objectifs ont bien été atteints. Cela prend en général la forme d'un diplôme, qui peut être reconnu par d'autres organismes et donc donner l'accès à un emploi, une fonction, à un niveau de formation plus élevé.

L'évaluation est donc un outil pédagogique (évaluation formative), qui contribue aux progrès de l'apprenant, et un outil de sélection (évaluation certificative).

Qu'évalue-t-on ?[modifier | modifier le code]

La complexité de l'évaluation est de savoir ce que l'on évalue exactement. Ainsi, dans un examen, on n'évalue pas seulement les connaissances, mais aussi la gestion de la tension nerveuse (stress), la stratégie (impasses, course aux points), l'ingéniosité (tricher sans se faire prendre), la chance… À l'inverse, l'évaluation continue permet de suivre au jour le jour le progrès des connaissances, mais est peu propice à la synthèse et la mémoire à long terme (la partie évaluée est restreinte et récente).

Dans un questionnaire à choix multiples, on va évaluer une capacité à trier, à se souvenir avec un support. Avec une composition (rédaction, dissertation), on va évaluer les connaissances mais aussi la capacité d'analyse, de synthèse, l'expression écrite. Dans un oral, on va évaluer en outre l'expression orale. Dans un jeu de rôle, on va pouvoir évaluer la gestion de la tension nerveuse, la réactivité, la capacité d'adaptation.

Dans une évaluation collective (entretien collectif, évaluation par projet), on va évaluer en particulier les savoir-être, la capacité à travailler en équipe.

La difficulté du problème posé n'est également pas anodine ; elle ne va pas simplement abaisser ou faire monter globalement les notes, elle va également changer ce qui est évalué. Prenons deux cas opposé :

  • on ne pose que des problèmes déjà traités durant la formation : on évalue la capacité de travail (« bachotage »), de mémorisation, de restitution, mais on ne détermine pas si la personne est capable d'utiliser ce qu'elle a appris dans un contexte nouveau ;
  • on pose un problème qui n'a jamais été vu : on évalue la gestion de la surprise, du stress, la capacité à prendre du recul… mais est-ce ce que l'on veut évaluer, et l'apprenant a-t-il été préparé sur ce point ?

Lorsque l'on conçoit une évaluation, il est donc primordial de savoir quels sont les objectifs de la formation, afin de pouvoir déterminer lesquels seront évalués ; et il faut se poser la question de l'adéquation entre le mode d'évaluation et les objectifs de la formation.

Risques d'une évaluation inadaptée[modifier | modifier le code]

Une évaluation inadaptée est une évaluation qui ne répond pas à la question posée, c'est-à-dire qui n'évalue pas, ou mal, les élèves vis-à-vis des objectifs de la formation.

Cela peut d'abord déboucher sur un problème de sélection : on risque de sélectionner un candidat ne correspondant pas au profil (mauvaise sélectivité) et éliminer au contraire un candidat intéressant (mauvaise sensibilité).

Cela peut également être un facteur de démotivation pour l'apprenant.

Une évaluation peut également être inadaptée parce qu'elle est inéquitable, par exemple parce que différents correcteurs attribuent les notes de manière différente. Outre le fait d'établir un barème plus précis, on peut mettre en place un système de péréquation des notes.

Évaluation des connaissances et capacité professionnelle[modifier | modifier le code]

Les mêmes principes règlent habituellement l'évaluation des connaissances aux deux bouts de la formation, dans l'enseignement supérieur et dans les apprentissages de base, se contentant de vérifier la possession d'un bagage, au mieux, d'un savoir-faire. Pourtant, l'exercice d'une profession est très loin de se limiter à la possession d'un ensemble de connaissances, d'un savoir formalisé. Si ce décalage n'est pas aussi pénalisant dans toutes les branches d'activités (les filières techniques étant peut-être moins affectées, par exemple), il n'en est pas de même dans toutes les branches où le facteur humain est sinon au premier plan, du moins reste une dimension incontournable ; peut-on être médecin, sans une certaine fibre psychologique ou assistant social sans empathie ?

Certes, on peut supposer qu'à l'origine le choix d'orientation a été fait en intégrant cette dimension et que l'élève, devant souvent évaluer ses aptitudes malgré son jeune âge, pourra développer favorablement les compétences nécessaires. On peut également espérer que la formation inclura des approches autres que l'acquisition d'un savoir technique au détriment du facteur social de la tâche, et qu'enfin, une évaluation permettra de vérifier les réelles capacités du futur professionnel en situation.

Dans tous les cas où ces supputations ne sont pas vérifiées, la validation d'une formation d'après une représentation du métier amputée de sa dimension humaine prend le risque de reconnaître comme apte professionnellement des personnes manquant des qualités requises pour un exercice harmonieux de leur métier. Individuellement, il y a dans ces cas, une perte progressive de motivation et finalement une mise en valeur non optimale des tendances de chacun et des compétences que chacun serait le plus à même de développer[réf. nécessaire].

Quoique l'évaluation ne devrait pas pour autant servir à vérifier l'affinité de l'élève avec son futur métier, puisque ceci est du ressort de vérifications bien antérieures, elle devrait permettre la prise en compte de capacités humaines au sens le plus large et en tout cas bien différentes de la pure acquisition de connaissances et de leur mise en application fictive.

Inversement, l'absence de prise en compte de talents non immédiatement liés aux connaissances sous-évalue la valeur professionnelle si ces talents sont en fait déterminants dans le quotidien du métier. Bien sûr, par la suite, l'activité donne à l'individu l'occasion d'exprimer son potentiel et ne conduit pas à la démoralisation ou à l'inadéquation éprouvée par celui qui est condamné à travailler en porte-à-faux de sa vocation, mais les risques de gâchis individuel et collectif demeurent : « Mais qui dira les frustrations, les amertumes stérilisantes chez tous ceux qui, pourvus des qualités nécessaires, n'auront jamais la possibilité de les faire servir au bien commun, puisqu'ils n'ont pas pu prouver, dans une épreuve de mathématiques, qu'ils avaient le sens des relations humaines, dans une épreuve de vérification des connaissances, qu'ils avaient l'esprit d'invention ! »[3]

Bibliographie[modifier | modifier le code]

Types d'évaluation[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :


Notes et références[modifier | modifier le code]

  1. Jean-Jacques Bonniol et Michel Vial, Les Modèles de l'évaluation : textes fondateurs avec commentaires, De Boeck Université, coll. « Portefeuille / Pédagogie »,‎ 1997, 368 p. (ISBN 2804126366, résumé), « 1 »
  2. Jérôme MARTIN, « Aux origines de la « science des examens », 1920-1940 », Histoire de l'éducation, no 94,‎ mai 2002, p. 177 (lire en ligne)
  3. Alfred Grosser, « Le cercle des élites », éditorial in Ouest-France du 22 février 1995.