Psychométrie

Un article de Wikipédia, l'encyclopédie libre.
(Redirigé depuis Psychométrique)
Aller à : navigation, rechercher

La psychométrie est la science qui étudie l'ensemble des techniques de mesures pratiquées en psychologie, ainsi que les techniques de validation et d'élaboration de ces mesures. Ces techniques concernent tous les champs de la psychologie, ainsi que d'autres domaines de sciences connexes (comme la recherche en comportement du consommateur par exemple). À l'origine, elles ont surtout émergées par l'intérêt croissant pour la mesure des performances intellectuelles porté notamment par le développement de l'échelle métrique de l'intelligence du psychologue Alfred Binet et Théodore Simon (âges mentaux ou quotient intellectuel, quotients de développement dans la petite enfance, etc.) ou bien pour l'analyse des composantes de la personnalité (affectivité, émotions, relations avec les autres, etc.). La psychométrie est la science de la mesure de l'esprit et s'établit en tant que telle par l'usage de procédures rigoureuses s'appuyant notamment sur l'usage de techniques statistiques variées[1].

Qualité psychométrique : fidélité et validité[modifier | modifier le code]

Un questionnaire d’autoévaluation, psychométrique, linguistique ou mathématique, est toujours composé de plusieurs questions. Dans tous les cas, on aimerait savoir si ce questionnaire d’autoévaluation, et donc les questions qui le composent, mesure vraiment ce que l’on cherche à mesurer. C'est pourquoi l’analyse de chaque question et la relation qu’ils entretiennent avec les autres questions du questionnaire d’autoévaluation, ainsi qu'avec le score total, sont primordiales. Dans le modèle du score vrai, plusieurs concepts peuvent être employés pour rendre compte de ces éléments.

Fidélité[modifier | modifier le code]

Article détaillé : Fidélité (psychométrie).

La fidélité ou fiabilité (en anglais : reliability) d'un test concerne sa capacité à mesurer un construit de manière cohérente : en d'autres termes, que la répétition de la mesure, soit dans le temps si le construit est supposé stable, soit en variant la formulation des questions, donne une estimation dont la variabilité diminue lorsque le nombre de points de mesure augmente. Certains des items sont parfois mesurés sur des échelles inversées (exemple de « je suis triste » et « je suis heureux »), afin de détecter des réponses trop « mécaniques » : il convient alors d'harmoniser ces échelles avant la poursuite du traitement.

Une des mesures traditionnelles de la fiabilité, ou fidélité, est le coefficient alpha de Cronbach : on y compare la somme des variances des mesures à la variance de la somme des mesures. La valeur maximale 1 est atteinte lorsque toutes les mesures sont parfaitement corrélées. L'American Psychological Association considère un construit comme acceptable quand le coefficient alpha est au moins égal à 0,7. Lorsqu'il de rapproche de 1, la qualité de la mesure devient discutable : il est alors probable que les items de mesure ne soient que de simples synonymes ou paraphrases, ce qui fait perdre tout son intérêt à cette répétition.

Validité[modifier | modifier le code]

Article détaillé : validité.

Validation externe du construit (en anglais : construct validity)[modifier | modifier le code]

Cette validation est beaucoup plus complexe que la validation interne, et elle vient après cette dernière: il s'agit de savoir dans quelle mesure le test proposé permet d'identifier de manière certaine le construit mesuré (par exemple, pour reprendre l'exemple ci-dessus, mon test est probablement capable de mesurer l'humeur, mais même si les deux questions sont inversement corrélées, il donne vraisemblablement une mesure faible (ou fausse) de la taille ou de l'intelligence des sujets, donc une faible validité externe en tant que tests de taille ou d'intelligence, mais une forte validité en tant que test de l'humeur).

Plusieurs types de validation peuvent et doivent être entrepris avant de prétendre à la validation d'un construit.

Validité de contenu ou validité apparente[modifier | modifier le code]

Premier niveau d'une procédure de validation, elle consiste à vérifier que les questions d'un test sont en rapport avec le construit qui est censé être mesuré. Par exemple, « êtes vous de bonne humeur » semble avoir une validité faciale pour un test mesurant l'humeur. En revanche, « quelle taille avez vous ? » ne l'a pas. Les problèmes de ce type de validation vient de sa subjectivité (mais on peut confier l'appréciation a un, voire plusieurs observateurs non-impliques dans le design du test). Également, les tests projectifs (par exemple le test de Rorschach ou le TAT) n'ont généralement, par définition, aucune validité apparente.

Validité convergente[modifier | modifier le code]

Composante indispensable d'une étude de validité, la validité convergente concerne la capacité d'un test à pointer les sujets dans les catégories réalisées. Elles sont réalisées avec l'appui d'autres critères diagnostiques, notamment en psychopathologie. Par exemple, il suffit qu'un test de schizophrénie vérifie que tous les schizophrènes diagnostiqués au cours d'entretiens cliniques avec un professionnel aient un score similaire pour prouver la validité convergente dudit test.

Cependant la validité convergente, parfois confondue avec la validité du construit, ne suffit pas, et rend un test particulièrement incertain en l'absence de validité discriminante.

Validité discriminante[modifier | modifier le code]

La validité discriminante vérifie l'envers de la validité convergente: il s'agit de savoir si seul le construit mesuré est mesuré par le test. En d'autres termes, il s'agit de savoir si le test fait bien la différence entre le construit mesuré et n'importe quel autre. Par exemple, un test mesurant la dimension schizophrène de la personnalité n'atteint la validité discriminante que si les schizophrènes sont les seuls à avoir un score supérieur ou inférieur a une certaine moyenne. Par exemple, si un test obtient une même réponse de tous les schizophrènes mesurés, il atteint la validité convergente, mais si des personnes originales ou normales font également la même réponse, le test n'aura pas de validité discriminante.

Validité nomologique[modifier | modifier le code]

La validité nomologique est le dernier élément permettant de conclure a la validité externe d'un test. On atteint la validité nomologique en prouvant une corrélation entre le test à valider et un autre test, déjà valide, qui mesure un construit qui devrait théoriquement être corrélé avec le construit mesure (sans être le même construit). Par exemple, un test mesurant l'alcoolisme peut atteindre la validité nomologique si on peut prouver une corrélation statistiquement significative avec un test mesurant l'impulsivité des sujets, une relation théorique existant entre les deux construits alcoolisme et impulsivité.

Test de validité et de fidélité des instruments[modifier | modifier le code]

La validité d'une méthode est son aptitude à mesurer ce qu'elle est censée mesurer, c'est-à-dire les variables telles qu'elles ont été définies avant leur opérationnalisation. La fidélité d'une méthode est son aptitude à fournir une mesure constante d'un phénomène constant.

Les tests de validité et de fidélité sont pratiqués sur les données recueillies et par conséquent à la dernière phase de l'enquête, ce qui peut sembler à juste titre intervenir trop tard.

Histoire[modifier | modifier le code]

Perception extrasensorielle[modifier | modifier le code]

Il existe une acception antérieure et différente du terme psychométrie, forgé en 1842 par le Dr Joseph Rodes Buchanan. Celui-ci présente dans son livre Manual of psychometry[2] une étude sur les capacités de certains sujets de percevoir, de manière extrasensorielle, des informations relatives à des lieux dans lesquels ils se trouvent ou à des objets qu'ils touchent. Il s'agirait donc d'une approche psychurge[réf. nécessaire]. Ainsi, le premier sujet étudié par le Dr Buchanan fut le général « bishop » Léonidas Polk, qui avait, entre autres, la faculté de « reconnaître » du laiton, dans l'obscurité et par un simple contact. Ce contact aurait provoqué chez lui la perception, en bouche, d'un goût particulier lui permettant d'identifier le laiton.

Bien que contestable au plan sémantique, l'usage du terme psychométrie pour désigner ces capacités extra-sensorielles semble trop bien établi pour que l'on puisse le remplacer. C'est ce qu'écrit l'abbé François Brune : « Le terme de « psychométrie » a été mal choisi, tout le monde le reconnait, mais il est maintenant trop bien implanté pour qu'on en change. » [3].

Théorie Classique ou Modèle du score vrai[modifier | modifier le code]

Le modèle du score vrai, parfois appelé théorie classique des scores ou modèle classique, prend naissance avec les travaux de Spearman (1907). Mais le modèle du score vrai tel que nous le connaissons aujourd’hui est principalement dû aux travaux de Gulliksen (1950), Magnusson (1967) et Lord et Novick (1968). Ce modèle se veut, comme mentionné par Lord et Novick (1968), un modèle de score vrai avec des postulats faibles, par opposition par exemple au modèle de poisson qui lui est considéré comme un modèle de score vrai avec des postulats forts. L’avantage d’un modèle avec des postulats faibles est qu’il peut être utilisé dans une multitude de situations et comme son nom l’indique, ses postulats sont relativement faciles à satisfaire et peu nombreux(Laveault et Grégoire, 2002). Le modèle du score vrai permet d’évaluer à quel point un score obtenu à un test reflète bien la compétence ou l’aptitude d’un individu en question. L’équation de base sur laquelle ce modèle repose est la suivante : X=V+E. Le modèle du score vrai postule que le score observé d’un individu (X) résulte de la somme entre le score vrai de l’individu (V) et l’erreur de mesure associée à ce score (E). On suppose donc qu’un individu possède un score « vrai » qui nous est inconnu et qui le demeurera. Cependant, il est possible de tenter de mesurer ce score vrai, l’on considèrera alors qu’il y a toujours une certaine erreur de mesure plus ou moins importante et qui ne pourra jamais être évitée complètement. De ce fait, le score observé (X) n’est que le reflet variable du score vrai (V). À ce propos, Bertrand et Blais (2004) notent que :

  • le score observé est une entité réelle, connue, variable d’une répétition à l’autre du test ;
  • le score vrai est une entité non observable, inconnue, fixe d’une répétition à l’autre du test ;
  • l’erreur de mesure est une entité non observable, inconnue, variable d’une répétition à l’autre du test ;
  • un score vrai est intimement lié à un individu particulier et à un test particulier : ainsi, le score vrai changera non seulement d’un individu à un autre, mais aussi d’un test à l’autre.

Ces affirmations ne sont pas seulement vraies pour le domaine de la psychologie ou de l’éducation, on peut facilement extrapoler au domaine plus général de la mesure en soi, qui n’est finalement, que très rarement exacte hors de tout doute.

Théorie de réponse à l'item[modifier | modifier le code]

La théorie de réponse à l'item a été développée durant les années 1950-1960. On distingue deux courants de pensée ayant évolué séparément, l'un provenant des États-Unis avec Frederic M. Lord, l'autre provenant du Danemark avec Georg Rasch. Le nom théorie de réponse à l'item vient du fait que cette théorie se focalise sur l'item et non sur le test comme dans la théorie classique des tests.

Notes et références[modifier | modifier le code]

  1. J.-L. Bernaud, Introduction à la psychométrie, Paris, Dunod, , 119 p. (ISBN 978-2-10-050377-3).
  2. Manual of psychometry - The dawn of a new civilization, Dr Joseph Rodes Buchanan, 1885.
  3. Le Nouveau Mystère du Vatican, père François Brune, éditions Albin Michel, 2002, p. 152.

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Manuels et textes généraux[modifier | modifier le code]

  • H. Chauchat, L'Enquête en psycho-sociologie, 1985.
  • P. Dickes, J. Tournois, A. Flieller, et J.-L. Kop, La Psychométrie, PUF, Paris, 1994.
  • C. Duflot, L'Expertise psychologique : procédures et méthodes, Dunod, 1999 (ISBN 210004222X).
  • D. Laveault et J. Grégoire, Introduction aux théories des tests en psychologie et en sciences de l'éducation (2e éd.), De Boeck Université, Bruxelles, 2002, 377 p.
  • M. Reuchlin, La Psychologie différentielle, PUF, 1969.

Articles universitaires[modifier | modifier le code]

  • (en) L. J. Cronbach, « Coefficient alpha and the internal structure of tests », dans Psychometrika, vol. 16, 1951, p. 297-333.
  • (en) L. J. Cronbach et P. E. Meehl, « Construct validity in psychological tests », Psychological Bulletin, vol. 52, 1955, p. 281-302.

Articles connexes[modifier | modifier le code]

Sur les autres projets Wikimedia :