Cours de psychologie

Analyse d'un corpus de données

Analyse d’un Corpus de Données

 

 

Objectifs généraux du module :

 

Consolider les connaissances méthodologiques et statistiques acquises depuis la première année en :

- Proposant un sujet d’études et les variables à mesurer ;

- Elaborant des mesures de ces dernières selon différentes modalités ;

- Réalisant des traitements sur les données recueillies à l’aide d’Excel.

Les étudiants devront appliquer ce qu’ils ont appris en cours de statistiques, de méthodologie, de psychométrie, d’échelles de mesure…

 

 

I. CM.

 

 

Elaborer un sujet d’étude avec les étudiants. La population ciblée de l’étude est les étudiants de L2 en psychologie à Nice.

Le projet retenu en 2013 porte sur la réussite aux examens des étudiants. Les discussions mettent en avant des variables ayant un impact potentiel sur cette réussite, qui est donc la variable dépendante de l’étude ; les autres variables sont conçues comme des variables indépendantes ou des variables corrélées à la variable dépendante. L’ensemble des variables à opérationnaliser pour le projet est le suivant :

1. Réussite aux examens.

2. l’impact des émotions sur la réussite aux examens.

3. le parcours d’études ayant précédé les études de psychologie.

4. l’intérêt des étudiants pour les matières, pour les différentes sous disciplines.

5. les activités en dehors de l’université (e.g., un travail).

6. les modalités de contrôle de connaissances (QCM, question ouverte, dossier à rendre…).

7. la façon de réviser en préparation des examens.

8. le moyen de transport utilisé par l’étudiant pour se rendre à l’université.

9. le rôle de l’entourage.

 

 

II. TD 1.

 

 

Objectifs : Proposer des hypothèses sur le lien qu’entretiendrait chaque variable indépendante ou corrélée avec la variable dépendante. S’inspirer des hypothèses pour s’aider à opérationnaliser les 9 variables identifiées ci-dessus afin de les proposer dans un questionnaire destiné aux étudiants. Prendre en considération la nature des réponses possibles, la clarté de la formulation des questions, la possibilité pour les sujets de pouvoir y répondre.

 

Exercices à réaliser : Les étudiants se mettent en petit groupe pour travailler ensemble sur une variable en lien avec la réussite aux examens (parmi la liste ci-dessus). Ils réfléchissent d’abord à des hypothèses qu’il sera possible de soumettre à validation. Ils proposent ensuite des mesures qui correspondent à différentes échelles : nominale, ordinale, d’intervalle, de rapports. Un travail sur la clarté des formulations des questions et leur correspondance à la variable ciblée est réalisé. La pertinence de différentes échelles de réponse est examinée.

 

Chaque étudiant complète un questionnaire sur une autre thématique afin de pouvoir traiter des données dès le TD2.

Une liste d’adjectifs, il faut indiquer de 1 à 5 dans quelles mesures ils nous décrivent de façon générale.

                - 1 : lorsque l’adjectif ne nous décrit pas du tout.

                - 2 : lorsqu’ils nous décrivent peu.

                - 3 : lorsqu’ils nous décrivent moyennement.

                - 4 : lorsqu’ils nous décrivent assez bien.

                - 5 : lorsqu’ils nous décrivent tout à fait.

Puis une liste d’affirmation, et il faut indiquer de 1 à 6 dans quelle mesure on est d’accord avec chaque affirmation.

                - 1 : pas du tout d’accord.

                - 6 : tout à fait d’accord.

 

Concepts clés à maîtriser :

- Chaque caractéristique étudiée s’appelle une variable.

- Une variable comporte plusieurs modalités qui lorsqu’elles sont numériques s’appellent des valeurs. Tout type de variable peut être recodé de façon numérique et donc avoir des valeurs (ex : le sexe).

- Le résultat observé pour la valeur ou la modalité d’une variable s’appelle une observation, c’est la réponse du sujet à une question dans notre contexte.

- Un tableau statistique sera donc composé de variables (en colonne) et d’observations par sujet (en ligne).

- Faire la distinction entre questions fermées et questions ouvertes.

 

Les échelles de mesures :

- Echelles nominales : Des mesures qui n’ont pas de réelle valeur numérique, même si des chiffres peuvent les représenter. Elles décrivent des catégories ou des qualités (ex : la profession des parents).

- Echelles ordinales : Les modalités de la variable sont liées par une relation d’ordre, des classements (ex : le classement dans la promotion exprimé en rangs).

- Echelles d’intervalles : Les modalités de la variable sont séparées par des intervalles égaux et permettent des opérations arithmétiques. Toutefois, la valeur de 0 est arbitraire et ne représente pas l’absence totale de la qualité.

- Echelles de rapports : Une échelle de rapport possède un vrai point zéro qui correspond à l’absence de la chose mesurée, et établit un rapport entre les modalités de l’échelle (i.e., la durée de 10s. est deux fois plus longue que la durée de 5s.).

 

 

III. TD 2.

 

 

Objectifs : Prendre conscience de la forme d’un fichier de données ; faire une analyse qualitative sur un fichier de données recueillies afin de relever des problèmes auxquels les sujets ont été confrontés, des difficultés pour l’analyse de certains types de réponse. Préparer un fichier Excel de données pour traitement en recodant des variables si nécessaire, en prenant en compte des valeurs manquantes, en corrigeant des problèmes de saisie de données. Voir comment des questions distinctes peuvent être regroupées pour former des échelles ; relever des items à inverser en termes de cotation. Réaliser des calculs de statistiques descriptives sur les variables du fichier.

 

Exercices à réaliser : Les étudiants répondent d’abord au questionnaire élaboré suite à la première séance. Les données seront traitées lors du TD3.

Examiner la structure générale du fichier : celui-ci comporte dans la première ligne les intitulés des différentes questions du questionnaire c’est-à-dire, les variables de l’enquête. Chaque variable est indiquée dans une colonne distincte. Les réponses d’un sujet donné se trouvent sur une ligne distincte : Les variables sont donc en colonne et les sujets en ligne.

 

 

1er Niveau de traitement :

- Comment traiter les données démographiques (à la fin du tableau à droite) ?  

+ La variable sexe est actuellement saisie avec les mots, Féminin ou Masculin. Les traitements sont facilités lorsqu’on utilise des chiffres.

+ Créer une nouvelle variable, sexe recodé (« SexeR) : ajouter une nouvelle colonne à droite de la colonne « sexe », copier-coller le contenu de la colonne « sexe » dans la nouvelle colonne que vous nommerez « SexeR ». Puis faire « ctrl+ F » pour recherche-remplacer « Féminin = 1 » et « Masculin = 0 » : notre variable sexe catégorielle, donc nominale, est recodée en valeurs numériques.

- Pour pouvoir faire des traitements, il faut vérifier la présence d’erreurs et le cas échéant les corriger (ex : dans la colonne âge, certains ont indiqué « ans » or cela va gêner le calcul de la moyenne d’âge de l’échantillon, le mot « ans » est à supprimer dans la colonne).

- Remarquez aussi qu’il y a des données manquantes, parfois, les sujets n’ont pas répondu à toutes les questions. Certains logiciels attribuent automatiquement une valeur équivalente à zéro à ces valeurs manquantes ce qui va influencer le calcul de la moyenne et autres statistiques. Ce problème se présente pour certains traitements avec Excel, donc il faut indiquer clairement que la valeur est manquante et pas une réponse ayant une valeur de 0 à traiter.

- Sélectionner toutes les réponses de tous les sujets à l’aide de la souris (des colonnes B à AO, et des lignes 2 à 136). Avec la fonction « rechercher-remplacer » (ctrl-F), ne rien mettre en « rechercher », en remplacer, mettre « M » pour recoder les réponses blanches par M pour valeur manquante. En cliquant sur « remplacer tout » vous aurez des M à la place des cellules vides. Comme « M » n’est pas une valeur numérique, le logiciel ne prendra pas en compte une réponse de M.

 

2e Niveau de traitement – statistiques descriptives :

Calculer les statistiques descriptives. Dans la colonne A, à partir de la ligne 138 et jusqu’à la ligne 146, taper les étiquettes pour les statistiques à calculer : SOMME, N, MINIMUM, MAXIMUM, MOYENNE, ET estimateur, ET échantillon, VAR estimateur, VAR échantillon.

Dans la colonne B, à côté de l’étiquette de la statistique à calculer, entrer la fonction qui permet le calcul, le calcul sera effectué sur la variable indiquée en haut de la colonne.

- SOMME : somme totale des réponses par colonne (exemple de la formule : =SOMME(Bx:By), où B correspond à la colonne et x correspond à la première ligne à prendre en compte, ici 2, et y correspond à la dernière ligne à prendre en compte, ici 136, donc pour la première variable il s’agit de taper dans la barre de formule en se positionnant en cellule B138 : =SOMME(B2:B136).

- N : nombre de valeurs valides (hors valeurs manquantes) : =NB(B.. :B…).

- MINIMUM : Valeur mini : =MIN(B.. :B…).

- MAXIMUM : Valeur max : =MAX(B.. :B…).

- MOYENNE : =MOYENNE(B.. :B…).

- ET estimateur : = ECARTYPE(B.. :B…) (l’estimateur non-biaisé de l’écart type de la population en utilisant un échantillon ; N-1 dans le dénominateur).

- ET échantillon = ECARTYPEP(B.. :B…) : (l’écart-type réel de l’échantillon, sans objectif d’estimer l’écart type de la population : N dans le dénominateur).

- VAR estimateur = VAR (B.. :B…) (l’estimateur non-biaise de la variance de la population en utilisant un échantillon ; N-1 dans le dénominateur).

- VAR échantillon =VAR.P (B.. :B…) (la variance réelle de l’échantillon, sans objectif d’estimer l’écart type de la population : N dans le dénominateur).

 

 

Utiliser « Aide » dans Excel pour avoir des explications sur la statistique calculée et la formule utilisée pour son calcul.

Une fois ces calculs réalisés pour la variable de la colonne B, sélectionner les cellules avec les formules de calcul (de B138 à B146), et positionner le curseur en bas à droite de cet ensemble de cellules pour faire apparaître une croix pleine. En maintenant le bouton de la souris enfoncée, tirer ces formules pour les copier vers la droite, jusqu’à la variable « sympathique » comprise. Examiner les calculs pour toutes les variables pour vérifier d’éventuelles incohérences qui signalent des erreurs à corriger. Examiner les résultats pour des variables qui ont fait l’objet de réponses manquantes.

 

 

3e Niveau de Traitement – recodage et statistiques descriptives du questionnaire Regulatory Mode :

- La théorie du Regulatory Mode décrit deux orientations dans la régulation des états des individus. Les individus dits « locomoteurs » cherchent principalement à passer d’un état à un autre, ils valorisent l’action et correspondent au slogan « Just do it ». Les individus dits « évaluateurs » cherchent à évaluer et comparer toutes choses de façon à toujours prendre la bonne décision ; ils fonctionnent selon « Do the right thing ».

- Dans la série de questions présentées en colonnes de B à AE, 12 items évaluent la « locomotion », 12 items évaluent l’ « évaluation », et 6 items sont des items de validité (duperie). Cette dernière échelle cherche à identifier des sujets qui ne répondraient pas de façon honnête au questionnaire. Un score élevé sur cette échelle pourrait donner lieu à l’invalidation du protocole du sujet en question.

- Identifier les items, sur la base de leur contenu, qui correspond aux deux orientations de régulation et à la duperie. Identifier également les items inversés, qui sont donc formulés de telle sorte qu’une réponse élevée représenterait un faible niveau de la qualité mesurée. Avant de faire des traitements plus élaborés, il faudra donc recoder les réponses de telle sorte que 6 = 1 ; 1 = 6 ; etc. Pour faire cela facilement, on rajoute un point à la valeur la plus élevée de l’échelle (ici 6, donc 6 + 1 = 7), et on soustraira la réponse du sujet de cette valeur. Ainsi, une réponse de 1 deviendra 6 (7 – 1) ; 2 deviendra 5, 3 deviendra 4, etc.

- A chaque fois que l’on recode une variable, on crée une nouvelle colonne à droite pour y mettre les réponses recodées. De cette façon on conserve toujours la colonne originelle qui permet de faire toutes les vérifications de notre travail. On nommera la variable inversée de façon à reconnaître l’item qui a été inversé. La question 2, par exemple doit être inversée ; on pourra nommer la nouvelle variable 2i. Dans la première cellule de la variable 2i, on tapera : =SI(A..= »M » ; »M » ;7-A..) ou A doit être remplacé par la lettre correspondant à la colonne qui contient la variable originelle et .. est le numéro de la ligne sur laquelle on travaille—donc 2 pour commencer. Cette fonction avec SI permet de tenir compte correctement des valeurs manquantes dans ces calculs ; si la variable originelle a une valeur manquante, alors la variable recodée l’aura également ; sinon, les score sera inversé en le soustrayant de 7. Une fois la fonction rentrée pour la première cellule, tirer la croix en bas à droite de la cellule jusqu’en bas de la colonne pour appliquer la fonction à l’ensemble des sujets.

- La liste complète des items à inverser : 2, 10, 13, 24, 27.

 

 

- Calculer l’ensemble des statistiques descriptives sur ces nouvelles variables en copiant les formules pour SOMME, N, MINIMUM, MAXIMUM, MOYENNE, ET estimateur, ET échantillon, VAR estimateur, VAR échantillon utilisées auparavant.

 

 

Ne manquez pas d’enregistrer le fichier avec toutes ces modifications prises en compte.

 

 

IV. TD 3.

 

 

Objectifs : Consolider les connaissances acquises en TD2 ; les appliquer sur un nouveau fichier de données. Apporter des analyses plus fines sur des variables mesurées avec le questionnaire élaboré en TD1.

 

Travail à réaliser : Reprendre le fichier de données sauvegardé à la fin du TD2. Calculer les scores moyens aux trois dimensions, les deux orientations de régulation plus l’échelle de mensonge (ou de duperie). Pour chaque nouvelle variable, rajouter une colonne (donc 3 colonnes) après la question 30 du tableau. Affectez des étiquettes : Evaluation, Locomotion, Mensonge. Il faudra pour chacune de ces variables, calculer la moyenne des réponses données aux différents items en utilisant le cas échéants les items inversés à la place des items originels ; le détail de ces calculs est présenté dans les paragraphes qui suivent.

 

ITEMS et CALCUL DES DIMENSIONS :

Les items inversés sont marqués par * et surlignés en jaune dans les formules qui suivent ; il s’agit des réponses aux différents items (numérotés de 1 à 30) du questionnaire. Pour faire ce calcul, cliquer sur la cellule du premier sujet pour la première nouvelle variable. Dans la barre de formules, taper « = » puis sélectionner une à une les cellules à additionner en mettant + entre chacune. Mettre des parenthèses autour de cet ensemble avant de diviser par le nombre d’items pris en compte pour calculer la moyenne. Recopier la formule vers le bas pour faire le calcul sur l’ensemble des sujets.

- Calcul de la Dimension « Evaluation » = (resp_2* + resp_6 + resp_7 + resp_9 + resp_10* + resp_11 + resp_15 + resp_19 + resp_20 + resp_22 + resp_27* + resp_30) / 12.

- Calcul de la Dimension « Locomotion » = (resp_1 + resp_3 + resp_4 + resp_5 + resp_8 + resp_13* + resp_16 + resp_21 + resp_24* + resp_25 + resp_28 + resp_29) / 12.

- Calcul de la Dimension « Duperie (Mensonge) » (dimension de validité) = (resp_12 + resp_14 + resp_17 + resp_18 + resp_23 + resp_26) / 6.

 

 

- Calculer l’ensemble des statistiques descriptives sur ces nouvelles variables en copiant les formules pour SOMME, N, MINIMUM, MAXIMUM, MOYENNE, ET estimateur, ET échantillon, VAR estimateur, VAR échantillon utilisées auparavant.

 

 

Ne manquez pas d’enregistrer le fichier avec toutes ces modifications prises en compte.

 

Traitement des données du 2e questionnaire, réussite aux examens : Discussion sur quelques variables choisies.

- Examiner le tableau de réponses. Décrivez les différentes formes de données et d’échelles de mesure utilisées. Quelles réponses semblent particulièrement difficiles à traiter ? Comment aborder les réponses aux questions ouvertes, libres ? Quelles questions ont donné lieu à des réponses ambiguës, pas claires ? Examiner la questionne de la colonne I. Comment traiter les réponses ? (les deux réponses « Oui » sont ambiguës ; difficile à interpréter).

- Examiner dans le détail les questions et réponses du Thème « Votre réussite aux examens. Est-ce qu’il y a une ou plusieurs dimensions ?

+ Quel regroupement d’items pourrait-on envisager ? (Il y a des questions qui demandent d’estimer sa performance à la dernière session d’examens ; des questions qui portent sur les notes obtenues en L1 ; la réponse à B est potentiellement une variable à part).

+ Quelles échelles sont utilisées ? Sont-elles équivalentes ? Doit-on envisager une transformation ? (des échelles sur 20 ; des échelles en 6 points allant de 0 à 5. Si l’on souhaite combiner des variables utilisant différentes échelles de mesure, il faudra d’abord les convertir à des échelles équivalentes).

 

 

 

V. TD 4.

 

 

Objectifs : Consolider les connaissances en les appliquant sur le fichier de données du questionnaire, réussite aux examens. Rendre opérationnelles les variables qui font l’objet d’hypothèses. Formuler des hypothèses, envisager les traitements statistiques permettant de les évaluer, réaliser les traitements et arriver à des conclusions concernant les hypothèses.

 

Travail à réaliser :

A) Traitement du Thème : Votre réussite aux examens

1. signaler des valeurs manquantes par des « M » ; rechercher remplacer M pour les cellules du tableau de données (voir le TD2 pour rappel).

2. Examiner les variables de réussite pour voir si des réponses sont problématiques : il faut remplacer les valeurs manquantes par M (certains sujets ont donné des réponses non valides, « / » par exemple—à remplacer par M. Puis changer les réponses du type « 3 absente » par 3, ou « 9 ou 10 » par 9,5).

3. Transformer la note espérée sur 20 (colonne C) en réussite espéré entre 0 et 5, en divisant les valeurs de la colonne C par 4. Pour cela, créer une nouvelle colonne à côté de C, la transformation est donc effectuée en D [avec l’opération =SI(C..= « M » ; « M » ; C…/4)]

 

 

4. Calculer la moyenne des notes estimées aux 5 matières (colonnes E à I) en colonne J.

 

 

5. Préparer le tableau pour les statistiques descriptives et les corrélations qui seront calculées en tapant les étiquettes à partir de la ligne 127 (colonne A). Ne pas faire les calculs ; toutes les variables nécessaires n’ont pas encore été créées. De la ligne 127 à la ligne 135, vous aurez :

+ Somme.

+ N.

+ Minimum.

+ Maximum.

+ ET estimateur.

+ ET échantillon.

+ VAR estimateur.

+ VAR échantillon.

- Puis, pour préparer d’autres calculs, taper les étiquettes suivantes à partir de la ligne A138 (ne pas faire les calculs ; ils ne marcheront pas à ce stade) :

+ 137 : Réussite.

+ 138 : Corrélation D-J.

+ 139 : B-J.

+ 140 : B-D.

+ 141.

+ 142 : Corrélation L-M.

+ 143 : Corrélation N-O.

+ 144.

+ 145 : Emotions.

+ 146.

+ 147 : Corrélation T-U.

+ 148 : Corrélation R-W.

+ 149.

+ 150 : Corrélation N W.

+ 151 : CorrélationOR.

6. Voir dans quelle mesure les variables B, D et J pourraient être regroupées car elles représentent différentes estimations de la réussite aux derniers examens. Dans la colonne B, à côté de l’étiquette adaptée, on utilise la formule du type: =COEFFICIENT.CORRELATION(D2:D124; J2:J124). Examiner donc les corrélations entre ces trois variables ; on obtient :

+ Corrélation D-J 0,674866962.

+ B-J 0,484993017.

+ B-D 0,54597647.

- Ces corrélations suggèrent la possibilité d’utiliser ces 3 variables ensemble.

- Calculer la corrélation entre L-M, les deux indications de réussite antérieure. La corrélation est de 0,493806801 ; elles pourront être utilisées ensemble.

- Mais la variable qui se trouve en colonne B utilise une échelle en 5 points allant de 1 à 5, alors que les variables en D et J sont actuellement codées de telle sorte à prendre des valeurs allant de 0 à 5. Nous devons donc transformer la variable B pour qu’elle ait une étendue de 0 à 5. Pour cela :

+ Afin de ne pas modifier les noms de colonnes déjà utilisés, nous allons mettre la variable transformée dans la colonne BW (ou BU si vous n’avez pas encore traité le thème « émotions » dans la partie B qui suit , en supprimant d’abord les éventuelles indications se trouvant dans cette colonne par erreur (« agité ». Indiquez la nouvelle étiquette de cette colonne, « Acquisition des connaissances : (B-1)*5/4 »

+ Puis, opérer la transformation suivante : en BW2 (ou BU2) : =(B2-1)*5/4 puis étirer à toute la colonne.

7 Calculer la corrélation entre L-M, les deux indications de réussite antérieure. La corrélation est de 0,493806801 ; elles pourront être utilisées ensemble.

8. Créer donc deux nouvelles variables, colonnes N et O, et donner les étiquettes « réussite estimée » et « réussite antérieure » à ces variables. Pour faire les calculs, pour la première il faudra additionner les scores BW (ou BU), D, & J et diviser par 3 (comme on a fait pour calculer des dimensions en TD3). Pour la réussite antérieure, on additionne L et M et on divise par 2.

+ (BWouBU + D + J)/3: réussite estimée → colonne N.

+ (L + M)/2 : réussite antérieure → colonne O.

- Si ces calculs ont été opérés sur des sujets ayant des « M », vous verrez afficher «#VALEUR ! », il faudra manuellement remplacer ces indications par « M ».

9. Corréler N et O : 0,373562436.

- Ces deux variables sont corrélées mais pas à un point qui nous amène à les regrouper ; elles semblent correspondre à différentes mesures de réussite.

10. Calculer les statistiques descriptives (étiquettes lignes A127 à A135) pour les variables de B à O.

 

B) Traitement du Thème : Emotions :

- Discussion sur les variables de P à U. T et U (influences positives et négatives) sont potentiellement liées.

11. Corréler les variables T et U : on obtient -.54. Donc, on pourrait les mettre ensemble, mais il faudra d’abord inverser l’une d’elles ; ce que l’on fait en 10 :

12. Inverser U pour la mettre en colonne V. (Voir le TD 2, 3e niveau de traitement. Attention aux valeurs manquantes, et à l’échelle utilisée ici. Cette variable utilise une échelle en 5 points ; pour l’inverser il faudra soustraire la réponse du sujet de 6.)

13. Calculer un nouveau score « influences Positives », à mettre en colonne W (=( T + V)/2)

14. Corréler R & W pour voir si les manifestations somatiques sont liées à l’influence positive. On obtient -.24 ; donc, à utiliser comme une variable à part.

15. Calculer les statistiques descriptives pour toutes les variables qui relèvent des émotions—variables de Q à W.

 

C) Proposer des hypothèses entre Emotion et Réussite :

- Réfléchir à des hypothèses que nous pourrions tester pour évaluer le lien entre les variables de la réussite et les émotions. Puis, faites les statistiques permettant d’évaluer ces hypothèses.

- A titre d’exemple :

+ Hypothèse 1 : Les étudiants qui affirment une influence positive du stress (variable W) auront une meilleure estimation de leur réussite (variable N).

. Il s’agit d’une hypothèse d’une corrélation positive entre ces deux variables.

. Calculer cette corrélation ; on obtient :

- corrélation N W 0,213496723

- N = 121 (le plus faible de N ou de W—comme la corrélation est calculé sur les paires de scores).

. L’hypothèse est validée par une corrélation plutôt faible, mais significative (on a confiance à 95% que la corrélation n’est pas égale à 0 dans la population sur la base de notre échantillon d’environ 120 sujets pour qui les données étaient complètes).

+ Hypothèse 2 : Les étudiants ayant une faible réussite antérieure (variable O) auront plus des manifestations somatiques à l’approche des examens (variable R).

. Il s’agit donc d’une hypothèse d’une corrélation négative entre les variables O et R.

. Calculer cette corrélation ; on obtient :

- corrélationOR 0,022867054

- N = 118.

. Cette corrélation est faible, très proche de 0. Elle n’est pas significative ; il est donc plausible qu’elle soit égale à 0 dans la population sur la base de notre échantillon. L’hypothèse n’est pas validée.

 

 

 

VI. TD 5.

 

 

Objectifs : Calculer et interpréter l’alpha de Cronbach comme indice de fidélité de cohérence interne sur une partie des données. Se familiariser avec la rédaction des parties méthodes et résultats d’un article scientifique, notamment en identifiant les statistiques à présenter dans ces parties.

 

Travail à réaliser :

1. En TD4, nous avions regroupé les scores des colonnes E à I en calculant leur moyenne (en colonne J). Normalement, cette démarche n’est justifiée que si les variables mises ensemble vont bien ensemble. Nous pouvons évaluer la cohérence de cette démarche avec l’alpha de Cronbach.

- Pour calculer l’alpha de Cronbach :

a) vous devez calculer la moyenne des inter-corrélations (rij) entre tous les items. Pour 5 items, il y a 10 corrélations à prendre en compte (k*(k-1)/2) ; elles sont présentées ci-dessous :

 

 

2. Examiner les variables démographiques :

- Sexe : Créer une nouvelle variable, sexe recodé (« SexeR ») : à mettre dans la colonne BX, copier-coller le contenu de la colonne « sexe » dans la nouvelle colonne BX que vous nommerez « SexeR ». Puis faire « crtl+ F » pour recherche-remplacer « Féminin = 1 » et « Masculin = 0 » : notre variable sexe catégorielle, donc nominale, est recodée en valeurs numériques.

- Age : Corriger les données lorsque les étudiants ont rajouté « ans » (ne garder que les chiffres, ou « M » pour valeur manquante ; pour le sujet qui a mis sa date de naissance, calculer son âge).

- Calculer les statistiques descriptives pour ces variables en recopiant les formules utilisées pour les variables déjà traitées.

 

3. Présentation des parties « méthode » et « résultats » de l’étude :

- Le texte ci-dessous décrit succinctement la méthode et les résultats principaux de l’étude menée à partir de ce recueil de données. Il présente tout d’abord la méthode, puis le matériel utilisé et pour finir les résultats obtenus. Cette rédaction correspond à celle utilisée pour rédiger un article scientifique présentant une étude empirique.

- Vous devez compléter ce texte où vous voyez des blancs avec les éléments de l’étude.

 

Méthode :

Nous avons fait passer un questionnaire sur les différentes variables en lien avec la réussite aux examens de psychologie à 123 étudiants de L2 à l’Université de Nice. L’échantillon était composé de 99 femmes et 24 hommes âgés de 18 à 29 ans (M = 21.0 ; ET = 1.96).

Matériel :

La réussite aux examens était estimée sur cinq matières (Neurobiologie, Statistiques, Développement, Cognition et Comportements, et Méthodes) en utilisant une échelle allant de 0 « très mauvaise réussite » à 5 « excellente réussite ». Nous avons calculé l’alpha de Cronbach sur l’échelle composée de ces cinq estimations et avons obtenu un coefficient de .53. Nous avons ensuite calculé la moyenne de ces cinq scores pour obtenir un score de réussite moyenne estimée aux matières.

Les sujets ont également répondu à une question sur leur sentiment d’acquisition et de compréhension des connaissances sur une échelle allant de 1 « pas du tout » à 5 « tout à fait » et ont estimé sur 20 leur moyenne générale à l’ensemble des examens. Nous avons corrélé ces deux mesures au score de réussite moyenne estimée aux matières et avons obtenu une corrélation de.48 pour l’acquisition des connaissances et de .67 pour la moyenne générale estimée. Ces corrélations justifiaient (bien que celle pour l’acquisition des connaissances soit limite) le calcul d’un score moyen de ces trois mesures que nous avons nommé réussite estimée. Comme ces mesures utilisaient des échelles différentes, avant de calculer la moyenne, nous avons fait des transformations permettant de les mettre sur une échelle commune allant de 0 à 5. Pour l’acquisition des connaissances, nous avons soustrait 1 point de la réponse donnée par le sujet et avons multiplié le résultat par 5/4. Pour la moyenne estimée, nous avons divisé la note par 4.

Les sujets ont également indiqué leurs moyennes obtenues aux deux semestres de la première année. Nous les avons moyennées pour obtenir un score de réussite antérieure (M = 11.2 ; ET = 1.38).

Concernant les émotions, les sujets ont répondu à deux questions utilisant des échelles en 5 points (allant de « pas du tout d’accord » à « tout à fait d’accord ») pour indiquer si le stress avait pour eux une influence négative ou positive sur leurs performances. Nous avons inversé la cotation de l’item sur l’influence négative pour pouvoir calculer un score moyen d’influence positive (les deux items étaient corrélés à -.54). Cette variable avait une moyenne de 2.8 et un écart-type de 1.08. Enfin, les sujets ont répondu à un item concernant les manifestations somatiques du stress sur une échelle en 5 points allant de « jamais » à « à chaque fois ». Cette variable avait une moyenne de 2.6 et un écart-type de 1.25.

Résultats :

La première hypothèse postulait une corrélation positive entre l’influence positive du stress et la réussite estimée globale. La corrélation obtenue est de .21 et cette corrélation est significative, ce qui soutient notre hypothèse.

La seconde hypothèse qui postulait une corrélation négative entre la réussite antérieure et des manifestations somatiques en lien avec les examens n’est pas validée. En effet, la corrélation de .02 n’est pas significative. 



22/04/2013
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 1514 autres membres