Cours de psychologie

Psychométrie

Psychométrie

 

 

Ouvrages en psychométrie :

Introduction à la psychométrie, Bernaud, J.L (2007)

La psychométrie : théories et méthodes de la mesure en psychologie, Dickes, P et al (1994)

Les tests de recrutement, Lussato (que sais-je?) (1998)

L'évaluation du personnel, Levy-Leboyer (2007)

 

La psychométrie est la mesure en psychologie. On parle de tests et il faut s’assurer qu’ils soient exacts. Le test peut aussi s’appliquer aux entretiens ou pendant une observation.

Psychométrie : science étudiant l'ensemble des techniques de mesures pratiquées en psychologie, ainsi que les techniques de validation de ces mesures. Ces techniques concernent tous les champs de la psychologie, ainsi que d'autres domaines de sciences connexes (comme la recherche en comportement du consommateur par exemple) mais elles ont été surtout développées, à l'origine, pour la mesure des performances intellectuelles (âges mentaux ou quotient intellectuel, quotients de développement dans la petite enfance, etc.) ou bien pour l'analyse des composantes de la personnalité (affectivité, émotions, relations avec les autres, etc.).
Elle est la science de la mesure de l'esprit, qui devient une science en introduisant l'arithmétique et le calcul dans les phénomènes de l'esprit car son fondateur était un mathématicien.

→ Sous-discipline de la psychologie, d’orientation méthodologique, dont les finalités sont d’étudier la mesure en psychologie et de développer les méthodes d’évaluation de caractéristiques individuelles.

 

 

I. La Corrélation

 

 

Technique statistique très utilisée en psychométrie.

Corrélation : statistique calculée lorsqu'il y a 2 variables mesurées sur les personnes. Mesure de 2 variables sur une population (ex : âge-poids, taille, pointure, stabilité émotionnelle, QI...) et on regarde s'il y a une relation entre ces deux variables.

 

On évalue le degré d'une relation linéaire entre ces deux variables → Si une des variable change, est ce que l'autre va changer avec ?

  - Une corrélation peut être positive (variable X qui augmente/baisse ; variable Y qui augmente/baisse en même temps → même mouvement). On parle de corrélation parfaite lorsque la corrélation r=1.00.

  - Ou négative (X augmente ; Y baisse (et vice versa) → mouvement inverse).

  - Corrélation nulle si 2 variables ne présentent aucune corrélation (corrélation de 0), la variable X ne renseigne pas sur la variable Y.

 

Dans un premier temps, on regarde un nuage de points sur un graphique.

Les 2 scores de chaque sujet sont représentés par un point.

 

 

Une corrélation peut varier de -1.00 (droite descendante) à +1.00 (droite montante).

Le signe indique le « sens » de la droite.

Attention ! Les corrélations parfaites n'existent pas en psychologie, sinon cela voudrait dire qu’on peut prédire le comportement de quelqu’un.
Aussi cela indiquerait qu’en mesurant une seule variable on pourrait dire avec exactitude quelles seraient les variations d’une autre variable.

 

 

 

 

 

 

On obtient  r = .80

C'est une corrélation forte et positive.

C’est-à-dire que les élèves qui ont réussi la première passation on réussi la seconde passation. Les élèves n'ayant pas réussi la première n'ont pas réussi la seconde. Les élèves ayant la moyenne à la première ont la moyenne à la seconde.

 

Pour dire qu'une corrélation est forte ou pas, il faut faire attention au contexte. Dans certains contextes, une corrélation de .30 sera considérée comme forte. Dans d'autres il faudra qu'elle soit de .90.

Quelque soit les mesures, on a besoin d'évaluer la qualité de ces mesures. C'est là qu'intervient la psychométrie.

 

L’idée est qu’à partir du moment où on attribue un chiffre à quelqu’un on est en train de mesurer.

La qualité de ces mesures est importante car elles vont conduire à des décisions importantes (embaucher quelqu'un, soigner quelqu'un, orientation scolaire…).

On utilise beaucoup de tests, de questionnaires, de mise en situations → donc beaucoup de chiffres à manipuler !

Il y a deux grands concepts pour parler de qualité en psychométrie :

  - La fidélité.

  - La validité.

 

 

 

II. La Fidélité (Rellabilitiy).

 

 

Les scores d'un test sont fidèles lorsque les scores ne changent pas à chaque fois qu'on fait la mesure. Les scores sont fidèles lorsqu'ils sont reproductibles. On peut détecter les différences inter-individuelles stables.

On utilise cette méthode en psychologie puisque chaque individu est différent, d'où l'utilité de pouvoir détecter les différences inter-individuelles.

Ex : pour mesurer une table avec exactitude, on la mesure plein de fois puis on fait la moyenne de toutes les valeurs obtenues.

→ C'est la procédure en psychologie. Pour mesurer l'intelligence, on a besoin de la calculer plein de fois. Les scores peuvent changer, mais on peut cependant garder une certaine stabilité (cf résultats de maths des élèves dans l'exemple précédent).

Ce qui peut expliquer les changements de scores (toujours dans l'exemple des enfants) : manque de sommeil, baisse de motivation en voyant que le test est identique, élève déconcentré pendant le test, meilleure lecture des consignes...

Tous ces changements posent problèmes en psychologie, et c'est pour ça qu'il est impossible d'obtenir une corrélation parfaite.

En psychologie on doit déterminer quel unité de mesure on va utiliser, car on ne peut pas utiliser des unités réelles comme des mètres ou autres. La difficulté est donc de savoir si on obtient à peu prés les mêmes scores à chaque nouvelle mesure.

 

En psychologie, on voudrait donc limiter les événements qui font changer les résultats d'une passation à l'autre → besoin de standardisation. Seul le hasard devrait influencer les résultats (et pas la fatigue, la concentration, la compréhension...). L’idée du hasard est qu’il y a au final autant d’erreurs positives que négatives et qu’à la fin la somme des erreurs serait nulle.

 

1. Théorie classique des tests :

 

Un score X est composé par une part de vérité et une part d’erreur qui peut être positive ou négative.

                   X = v + e

Le score de la personne = partie vraie + part d'erreur (positive ou négative).

Pour calculer la vérité, on va corréler le score à la première passation et le score à la seconde passation.

Ce qui est erreur ne peut corréler à rien.

L’erreur n’est corrélée à rien puisqu’on ne peut pas prédire les erreurs. Donc seules les parties vraies peuvent corréler : r(vv) = pourcentage de variance dans les scores qui est la partie vraie ; le restant est attribuable à l'erreur de mesure.

On ne peut parler de pourcentage de variance uniquement dans le cas de la fidélité.

Dans l'exemple du test de maths : r = .80 →  80% de vrai, et 20% d'erreur. 80% de variabilité stable, et 20% de variabilité aléatoire.

Fidélité : Rvv = pourcentage de variance dans les scores qui est la partie vraie ; le restant est attribuable à l’erreur de mesure.

On ne parle de pourcentage en corrélation que lorsque l'on parle de la fidélité.

Exemple des enfants : si les scores ne sont pas identiques au 2 passations, c'est qu'il y a une part de hasard. Une grande partie des scores est stable, dont reproductible.

 

Modèle théorique : S'il était possible de construire deux tests de telle sorte que leurs scores vrais soient identiques, alors la différence constatée entre les scores observés serait due à l'erreur.

Ex : On sait que la mesure aux 2 passations doit être la même. S'il y a une différence entre les 2 passations, c'est qu'il y a une erreur → c'est l'erreur qui change le résultat.

Mais dans la réalité : il est impossible de trouver 2 tests qui aient des scores vrais identiques.

 

2. Approches pratiques :

 

Aucune approche n'est parfaite !! A chaque fois il y a des avantages et des inconvénients.

 

a. Test-retest :

 

Si on veut avoir deux mesures identiques, pourquoi ne pas utiliser le même test ?

Normalement si on fait passer deux fois le même test, il s’agit d’un test parallèle et donc on obtiendra le même résultat. Et en cas de différence entre les score ce sera du à l’erreur.

Il s'agit de faire passer le test à un groupe, d'attendre un certain laps de temps, puis de faire repasser le même test au même groupe.

→ Approche utilisée pour l'exemple de la corrélation (même test à une semaine d'intervalle).

Avec cela, on peut calculer la corrélation.

Les scores diffèrent entre les deux passations parce que :

  - Erreur.

  - Il y a de l''erreur aléatoire dans chaque passation du test.

  - Il y a la possibilité de l'apprentissage entre les deux passations.

  - Il y a un effet du test (on se rappelle de certaines question, donc on en cherche la réponse après le test).

  - On peut se souvenir de ses réponses à la première passation.

  - Les conditions de passation peuvent ne pas être identiques (mauvaises consignes, bruit, fatigue, processus de maturation surtout chez l'enfant...).

→ On attribut ça à l'erreur, même s'il peut y avoir des changements qui nous intéressent.

 

La difficulté principale avec cette approche est : le laps de temps : combien de temps laisser passer entre les deux passations ?

Plus le délai est cours, moins il y a que risque d'apprentissage entre les 2 passations. Mais il y aura davantage de fatigue, et on n’a pas le temps « d'oublier » nos réponses.

Pour les enfants, il ne faut surtout pas utiliser un laps de temps long, car il y a beaucoup d'évolution.

Avec les adultes, on peut imaginer que les choses sont plus stables, donc le laps de temps peut être plus long.

  - Coefficient de stabilité = laps de temps long, l’intervalle entre les 2 mesures est de plus de 2mois. Plus le coefficient de stabilité est élevé, plus les scores sont stables dans le temps.

  - Coefficient de confiance = laps de temps court, l’intervalle entre les 2 mesures est de moins de 2mois.
Le test donne les mêmes résultats en peu de temps.

Il n’existe pas de laps de temps qui s’adapte à toutes les populations. Il faut l’adapter en fonction de la population qu’on étudie.

 

Approche importante dans les tests de recrutement par exemple. Il faudrait qu'une personne ait de bons résultats à l'entrée, et une bonne fidélité. C'est à dire qu'il faudrait que la personne ait les mêmes résultats quelques années après.

 

b. Formes parallèles (parallel forms) :

 

Elaboration de 2 tests différents sensés représenter la même chose. Elaborer deux tests équivalents.

Ex de tests mathématiques : 2 formulaires avec 20 problèmes chacun. Les questions sont différentes mais la difficulté est la même.

Faire passer le premier formulaire à un groupe.

Attendre un peu (ou pas !) : Laps de temps moins important qu'avec la méthode du test-retest car il n'y a pas nécessité d'oublier ce qui s'est passé lors de la première passation. On n’enchaine pas les deux formulaires uniquement pour une raison de fatigue.

Faire passer le second formulaire au même groupe.

Calculer la corrélation → c'est la fidélité de forme parallèle.

 

Les scores différent entre les deux formulaires parce que :

  - Est ce que les deux formulaires sont vraiment parfaitement équivalentes ?

  - Attribuable aussi à l'erreur.

Le laps de temps pose aussi problème : fatigue, changement dans la personne... mais cette difficulté est largement réduite par rapport à l'approche test-retest.

 

c. Cohérence interne (internal consistency) :

 

Deux moitiés (split halves) :

 

Il suffit de faire passer un seul test, une seule fois. C'est l'approche la moins couteuse. 

La question du laps de temps ne se pose plus. Idem pour la question de l'équivalence des formulaires.

PB : comment calculer une corrélation avec un seul test ?

 

Le test est divisé en deux.

Deux scores sont attribués au même test.

En général, on effectue la division selon items pairs et items impairs (pour éviter, par exemple, un résultat plus faible dans la seconde moitié du test à cause de la fatigue).
On peut donc calculer la corrélation entre les résultats obtenus.

Mais cela représente la fidélité de la moitié du test.

Il faut donc appliquer la formule de Spearman-Brown (à n'utiliser que dans ce cas précis) :

 

 

 

Ici : 88% de la variance dans les scores est stable. 12% n'est pas explicable, c'est l'erreur qui fait qu’on n’obtient pas les mêmes scores aux 2 moitiés.

Mais difficulté : les deux moitiés ne sont peut être pas totalement équivalentes.

On a cependant évacué les difficultés de la méthode test-retest et de la méthode de formes parallèles.

 

Alpha de Cronbach :

 

C'est la plus utilisée en cohérence interne.

Il a été démontré que c'était l'équivalent de la moyenne de tous les coefficients obtenus en utilisant toutes les moitiés possibles lors d'un test. Il s'agit de la moyenne de toutes les possibilités.

 

 

 

Avec le dernier tableau : il faudrait corréler la colonne de l'item 1 avec item 2 ; 1 avec 3 ; 1 avec 4 ; 2 avec 3...

Beaucoup trop long à faire à la main !

Approche extrêmement généralisable.

 

De façon générale :

  - Plus le test est long, plus la fidélité est élevée.

             + Quand on a un seul item, la fidélité est très faible, puisque la part d'erreur peut prendre des proportions excessives.

             + Plus il y a d'items, plus d'effet de l'erreur risque de s'annuler.

  - Plus la moyenne des corrélations est élevée, plus la fidélité est élevée.



18/01/2013
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 1520 autres membres