Cours de psychologie

Statistiques inférentielles - TD

I. TD 1.

 

 

1. Exercice 1 :

 

Dans le but d’améliorer les performances de mémoire des personnes âgées de plus de 65 ans, des chercheurs ont établi des programmes d’entrainement mnésique. 150 personnes participent à l’étude. Afin de diminuer la probabilité d’avoir dans leur échantillon des personnes atteintes de démences, le Mini Mental State Examination est administré à chaque participant. Seules les personnes ayant un score supérieur ou égal à 27, ont été incluses dans l’étude. Au tout début de l’étude, la mémoire des 150 participants est évaluée (Temps 1). Puis de manière aléatoire, le tiers des participants (50) sont affectés au groupe « entrainement » à savoir qu’ils apprendront certaines stratégies pour mieux mémoriser, et ceci à raison de 4 séances par semaine de 2h, pendant 4 semaines. Un autre tiers (50) est affecté à un groupe de discussion sur la mémoire et le vieillissement en général, à raison de 4 séances par semaine de 2h, pendant 2 semaines également mais lors de ces discussions, aucune stratégie mnésique ne leur est apprise (les participants échangent sur leur vision du vieillissement, les difficultés mnésiques au quotidien, etc.). Enfin, le tiers restants (50) ne suivra ni entrainement ni groupe de discussion, il est le groupe contrôle.

Vous savez tous ce qu’est un groupe contrôle ? Afin d’évaluer si la manipulation d’une variable a un effet sur une autre variable, on compare le groupe expérimental avec un groupe contrôle qui ne subit pas la manipulation. A la fin des quatre semaines, les performances de mémoire des 150 participants sont à nouveau réévaluées, avec le même test que celui utilisé en T1.

Dans cette étude, les sujets devaient également répondre à un questionnaire sur le sentiment d’auto-efficacité mnésique (il s’agit de la confiance que les personnes manifestent en leurs capacités de mémoire), un questionnaire de personnalité (ce questionnaire était centré sur le trait de personnalité « névrotisme », et un questionnaire sur des données démographiques (qui sondait l’âge, le sexe, une évaluation subjective de l’état de santé, et la présence ou pas de démences de type Alzheimer ou apparentées chez les proches).

 

Les variables prises en compte :

  - Variable « groupe » (entrainement, discussion, contrôle) : La variable est notée G. Le groupe « entrainement » est codé 1, le groupe « discussion » est codé 2, et le groupe « contrôle » est codé 3.

  - Variable « sexe du sujet » : La variable est notée S. Les hommes sont codés 1 et les femmes sont codées 2.

  - Variable « âge » : La variable est notée AGE. Les âges sont codés tels les âges réels (72 est codé 72 ; 81 est codé 81).

  - Variable « santé » : La variable est noté S. Les sujets devaient évaluer leur état de santé sur une échelle continue allant de « très mauvaise » à « très bonne ». Il s’agit pour le participant de placer une croix sur une ligne continue.

   Les centimètres séparant le début de la ligne et la croix posée par le participant sont ensuite mesurés et la variable est codée avec ces centimètres.

  - La variable « Mini Mental State Examination » : Elle est codée MMSE. Il s’agit d’un score allant de 0 à 30, correspondant au nombre de bonnes réponses sur les 30 items.

  - Variable de personnalité « névrotisme » : La variable est noté N. Les sujets doivent répondre à un questionnaire de 10 questions portant sur le trait de personnalité « névrotisme ». Chaque question est une affirmation (ex : « Je me laisse facilement dépasser par le stress ») et le participant doit dire dans quelle mesure ces affirmations lui correspond sur une échelle en 10 points allant de 1 pour « Pas du tout moi » à 10 « Tout à fait moi » :

                                       Pas du tout moi 1---2---3---4---5---6---7---8---9---10 Tout à fait moi

   Les réponses aux 10 questions (items) sont ensuite additionnées de manière à constituer un score de névrotisme allant de 10 à 100. Un score proche de 10 signifie un trait névrotique peu marqué, un score proche de 50 signifie un trait névrotique très marqué.

  - Variable « sentiment d’auto-efficacité mnésique » : La variable est codée SAEM. Les participants évaluaient leur mémoire sur l’échelle suivante : « très mauvaise», « plutôt mauvaise», « ni bonne ni mauvaise », « plutôt bonne », « bonne », « excellente ». Très mauvaise est codé 1, plutôt mauvaise est codé 2, « ni bonne ni mauvaise » est codé 3, « plutôt bonne » est codé 4, « bonne » est codé 5, et « excellente » est codée 6.

  - Variable « proches Alzheimer » : La variable était codée AZ. Les participants rapportaient s’ils avaient parmi leurs parents, oncles et tantes, frères et soeurs ou cousins germains, des personnes qui avaient reçu un diagnostic de maladie d’Alzheimer ou autres démences apparentées. Les réponses étaient codées 1 pour « non » et 2 pour « oui », et 3 pour « je ne sais pas ».

  - Variables « performance de mémoire » en T1 et en T2 : Les participants se voient administrés un test de rappel libre de mots. Il s’agit d’une liste de 16 mots. On considère ici le nombre de mots correctement rappelés (ex : si 16 mots sont correctement rappelés, on code 16, si 12 mots sont correctement rappelés, on code 12, etc.).

  - Variable « différence de performance de mémoire entre T1 et T2 » : Ici, il s’agit d’une variable intra-sujet (la performance en T2 de l’individu 1 est comparée à la performance en T1 de l’individu 1, la performance en T2 de l’individu 2 est comparée à la performance en T1 de l’individu 2, etc. La comparaison se passe « à l’intérieur du » même sujet. Dans les autres variables, on compare les individus entre eux, il s’agit alors de variables inter-sujets.

 

 

 

2. Exercice 2 :

 

Dans le contexte théorique de la menace du stéréotype, un chercheur souhaite déterminer les effets du stéréotype lié l’âge et la mémoire sur les performances à une tâche mnésique. La figure ci-dessous représente les pourcentages de mots correctement rappelés à une tâche de rappel libre par des adultes de moins de 30 ans pour certains et de plus de 60 ans pour d’autres. Pour la moitié d’entre eux (la moitié des moins de 30 ans et la moitié des plus de 60 ans), la tâche était présentée comme une tâche de mémoire, pour l’autre moitié, elle était présentée comme une tâche d’apprentissage (le mot mémoire n’est alors jamais prononcé par l’examinateur).

 

 

Commentez cette figure (identifier les variables et décrire les résultats).

VI :

    - Age à 2 modalités.

    - Façon de présenter la tâche : 2 modalités apprentissage et mémoire.

VD : nombre de mots rappelés.

Même nombre de mots rappelés pour les jeunes que ce soit en apprentissage ou en mémoire. Pas d’interaction entre les 2 VI.

Plus de mots rappelés en apprentissage qu’en mémoire à cause de stéréotype. Donc il y a interaction.

 

 

II. TD 2.


 

1. Exercice 1 :

 

Une recherche est réalisée pour étudier l’efficacité d’un traitement psychothérapeutique sur les niveaux de dépression. On constitue deux groupes de personnes : un groupe expérimental composé de personnes qui souffrent de dépression et un groupe contrôle qui ne souffrent pas de dépression. Pour vérifier que les personnes du groupe expérimental souffrent effectivement de dépression et pas les personnes du groupe contrôle, on leur demande de remplir une échelle de dépression. Elle permet de dépister des cas de dépression et évaluer l’intensité de la symptomatologie dépressive. Le score varie de 0 à 10, les scores les plus élevés correspondant à la présence d'une symptomatologie plus sévère. Il a été proposé qu’une note seuil de 6 ou plus témoigne d’une symptomatologie dépressive élevée. Le tableau ci-dessous donne les scores des personnes de chaque groupe :

 

 

Quelles sont les variables dépendante et indépendante ?

VI : groupe contrôle ou groupe expérimental.

VD : niveau de dépression.

 

La variable dépendante est-elle une variable qualitative ou quantitative ? Discrète ou continue ?

C’est une variable quantitative discrète.

 

Comment pourrait-on formuler l’hypothèse opérationnelle ?

Les personnes souffrant de dépression devraient avoir un score plus élevé sur l’échelle de dépression que les gens « sains ».

 

Pour décrire les données, construire les distributions d’effectifs et de fréquences (et fréquences cumulées) et calculer les moyennes et écart-types pour les deux groupes séparément.

 

 

2. Exercice 2 :

 

Un test de QI est normalisé sur une moyenne de 100 et un écart-type de 15. Quelle est la proportion de sujets qui ont un QI qui s’écarte d’au moins 10 points de la moyenne ?

M = 100 et S = 15.

On utilise la note z = (x – m) / s :

- z110 = (110 – 100) / 15 = 10/15 = 0,67.

- z90 = (90 – 100) / 15 = -10/15 = -0,67.

- Sur la table de la loi normale on trouve : 0,7486.

On cherche donc : p(Qi>110) + p(Qi<90) = p0,67 + p(-0,67) = 1-0,7486 + 1-p(z<0,67) = 2514-0,2514 = 50,28.

!! N’ayant pas la table des négatifs, on inverse le signe de 0,67 en changeant < et > !!

Donc, environ la moitié des sujets a un Qi qui s’écarte d’au moins 10 points de la moyenne.

 

Se souvenir que :

                - Quand on a un z négatif, il faut inverser < et >.

                - Quand on fait 1-P il faut inverser < et > :

                               + P(z<x) = P(z>-x).

                               + P(z>x) = 1-P(z<x).  

 

Dans votre université, la taille des étudiants se distribue normalement. La moyenne de la distribution est 162 centimètres et son écart-type est de 8 centimètres. Quel est le pourcentage d’étudiants dont la taille est égale ou supérieure à 172 centimètres ?

M = 162 et s =8.

Z = (172-162) / 8 = 1.25.

Pz = 0,8943 = p(z>1,25) = 1-P(z<1,25) = 1-0,8943 = 0,1057.

Si on a la table de z bilatérale externe cumulée : on tombe sur 0,211. La table étant bilatérale, et la probabilité recherchée étant unilatérale, on doit diviser par deux, soit : 0,211/2 = 0,1055.

Il y a donc environ 11% d’étudiants dont la taille est égale ou supérieures à 172cm.

 

Un test d’anxiété est normalisé sur une moyenne de 8 et un écart-type de 4. Quelle est la proportion de sujets qui ont un score d’anxiété compris entre 7 et 10 ?

M = 8 et s = 4.

On utilise la note z = (x – m) / s :

- z7 = (7-8)/4 = -0,25.

- z10 = (10-8)/4 = 0,50.

- Sur la table on trouve : z10=0,6915 et z7=0,5987.

Z10 étant positif, on garde 0,6915.

Z7 étant négatif : 1-0,5987 = 0,4013.

Donc P = 0,6915 – 0,4013 = 0,2902.

29% des sujets ont un score d’anxiété compris entre 7 et 10.

 

En résumé :

- S’il n’y a qu’un calcul : faire la note z → z = (x – m) / s. La note z donne le résultat (réponse en pourcentage plus facile).

- S’il y a deux calculs : faire la note z pour chacun. Attention, s’il y a une note z négative, il faut penser à faire 1-z pour avoir le bon résultat. Et soustraire les deux.

 

 

III. TD3.

 

 

1. Exercice 1 :

 

Un chercheur australien souhaite tester l’hypothèse selon laquelle les aborigènes ont davantage de problèmes de santé mentale que les australiens en général. Une échelle a été construite pour évaluer les problèmes de santé mentale (score de dépression, anxiété, dépendance à l’alcool et aux drogues, idées suicidaires, etc.).

Au niveau de la population des australiens, la distribution d’échantillonnage de la moyenne à cette échelle suit loi normale de paramètres n (μ = 8 et σ = 7).

Le chercheur étudie un échantillon de 200 aborigènes sélectionnés dans diverses régions d’Australie et leur demande de remplir l’échelle de santé mentale.

Pour comparer la moyenne de son échantillon à celle de la population de référence (les australiens en général), il calcule une statistique z qui s’appuie sur la loi normale et obtient z = 2.06. Cette statistique évalue le degré d’accord entre les données qu’il observe et celle qu’il s’attend à observer si H0 est vraie.

 

Enoncer l’hypothèse générale.

Les aborigènes ont plus de problème de santé mentale que les australiens en général.

 

Enoncer les hypothèses opérationnelles.

La moyenne des aborigènes à l’échelle de santé mentale sera supérieure à la moyenne des australiens en général.

 

Enoncer les hypothèses statistiques.

H0 = c’est toujours une hypothèse d’absence de différence.

H0 = m=8, on ne teste pas H1 mais H0.

HI = m>, le but est de tester H0 pour décrire H1.

 

L’hypothèse du chercheur est-elle soutenue ? Justifier votre réponse.

Z = 2,06 → P = 0,9803.

98,03% de la population ont un score < à 2,06.

Donc 1,97% seraient > 2,06.

Or, 5% est le seuil de rejet.

Donc, on rejette H0 et on accepte H1.

On peut dire scientifiquement que les aborigènes ont plus de problèmes de santé mentale que les australiens.

L’hypothèse du chercheur est donc soutenue.

 

Quelle valeur minimum du z fallait-il observer pour valider l’hypothèse opérationnelle au seuil α=.05 ? Au seuil α=.01 et α=.10?

α = 0,05 → avec 95% de certitude → z = 1,6445.

α = 0,01 → avec 99% de certitude → z = 2,325.

α = 0,10 → avec 90% de certitude → 1,285.

 

2. Exercice 2 :

 

Un psychologue a conçu un test qui permet de mesurer les aptitudes logiques d’adultes normaux au QI normal. Ce psychologue souhaite commercialiser ce test auprès de différentes organisations (e.g., associations, entreprises, etc.) pour aider au recrutement de salariés sur des postes nécessitant de très bonnes logiques, et auprès d’hôpitaux et autres centres psychiatriques pour détecter des troubles touchant à la sphère logique et liés à certaines pathologies. Une fois le test conçu, le psychologue procède à son étalonnage sur une population composée d’adultes (des deux genres, de toutes professions, de tous niveaux socioculturels et de toutes origines ethniques). Ils ont par ailleurs tous un QI normal ; les aptitudes logiques sont notées de 1 à 7. Sur la base de cet étalonnage, le psychologue concepteur du test prévoit que des sujets adultes de QI normal doivent se répartir sur les 7 notes de la façon suivante :

 

 

 

 

IV. TD4.

 

 

1. Exercice 1 :

 

Des chercheurs font l’hypothèse que l’agressivité des enfants en école maternelle est liée à l’environnement dont ils disposent. Plus précisément, ils supposent que moins les enfants disposent d’espace et plus ils sont agressifs. Pour tester leur hypothèse, ils constituent un échantillon de 110 enfants en école maternelle. Ils recueillent ensuite 1/ auprès des enseignants de chaque enfant s’il s’agit d’un enfant manifestant une agressivité faible ou forte, et 2/ auprès des directeurs d’école maternelle la taille des classes, des espaces de jeux et des cours de récré, informations à partir desquels ils créent ensuite deux catégories : environnement peu spacieux, environnement spacieux.

 

 

Formulez hypothèse générale.

L’agressivité des enfants en école maternelle dépend de l’environnement dont ils disposent.

 

Calculez les fréquences conjointes. Que constatez-vous ?

Totalité des enfants en environnement peu spacieux = 16 + 52 = 68.

Totalité des enfants en environnement spacieux = 30 + 12 = 42.

Totalité des enfants avec agressivité faible = 16 + 30 = 46.

Totalité des enfants avec agressivité forte = 52 + 12 = 64.

Totalité des enfants = 110.

 

Fréquence : effectif / effectif total.

- Faible/peu spacieux = 16/110 = 14%.

- Faible/spacieux = 30/110 = 27%.

- Forte/peu spacieux = 52/110 = 47%.

- Forte/spacieux = 12/110 = 11%

 

On constate que la proportion d’enfants avec une agressivité forte est plus importante dans le cas d’un environnement peu spacieux.

 

Testez l’hypothèse au seuil α = .05 (c’est-à-dire, poser les hypothèses statistiques, choisir une statistique de décision en justifiant votre choix, calculer la statistique de décision, et conclure).

H0 : pas de différence d’agression entre environnement spacieux et non spacieux.

H1 : agression dans environnement non spacieux plus importante que dans environnement spacieux.

On utilise χ² d’indépendance (car 2*2).

χ²(c-1)(L-1) = [n(n11n22 – n12n21)²] / n-1n-2n1n2.

 

2. Rappel :

 

Fréquence théorique (pour un 2*2) = eij = (RiCj) / T

                - Ri = total de la rangée.

                - Cj = total de la colonne.

                - T = total global de toutes les cellules du tableau.

 

Variance : dispersion autour de la moyenne : S² : σ² = ∑x²/N – m² = (tous les x² un par un puis additionnés, résultat divisé par tous les n, et le tout soustrait avec la moyenne au carré).

Variance corrigée = [N/(N-1)] * S².

                          = (N/n-1) * (∑x²/N – m²).

                          On peut aussi calculer : [(∑x²)/(N-1)] / N-1.



02/04/2013
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 1519 autres membres