Cours de psychologie

Statistiques inférentielles (suite 2)

3. Le degré d'association entre deux variable (force de liaison) :

 

Différents indices pour estimes la force de la liaison.

 

 

 

4. Le χ2 d’homogénéité :

 

Même calcul que pour le χ2 d’indépendance mais la question posée est différente, donc les formulations d’hypothèses statistiques et des conclusions sont différentes.

  - H0 : les variables se distribuent de manière homogène au sein des échantillons.

  - H1 : H0 est fausse pour une au moins des modalités.

 

 

Ex : la question qu’on se pose est le lien entre l’âge des femmes et le type de voiture qu’elles vont préférer.

→ Homogénéité des préférences concernant l’aspect esthétique de ces voitures selon les classes d’âge?

- Le psychologue constitue 3 groupes (échantillons) de femmes correspondant chacun à une classe d’âge (N=493).

 

 

 

- Il faut ensuite comparer : dans ce cas le χ2 critique est supérieur au χ2 observé (pour que H0 soit rejetée il faut que le χ2 critique soit inférieur au χ2 observé).

- Conclusion :

       + Conclusion au seuil α = .05 que les préférences des femmes pour les modèles de voiture sont homogènes quel que soit leur âge.

       + Autrement dit, les préférences à l’égard des modèles de voiture ne varient pas en fonction de la classe d’âge des femmes.

→ Il n’y a pas de rejet de H0, il n’y a donc pas d’homogénéité, donc il n’y a pas de relations entre les deux variables mesurées.

 

5. Le test de Mc NEMAR : deux échantillons appariés pour une variable dichotomique :

 

Même groupe de personnes passant deux fois la même épreuve pour lesquels les résultats sont notés en termes de succès et d’échec : oui/non, absence/présence, etc.

Deux échantillons appariés d’effectif total n, classés suivant une variable dichotomique.

 

 

Mêmes sujets qui répondent aux deux modalités des variables. Deux échantillons de données avec les mêmes personnes.

Hypothèses statistiques :

  - Soit π et π’ les fréquences de « succès » dans chacune des deux populations dont on a extrait ces deux échantillons appariés.

  - H0 : π = π’ (la fréquence de succès avant est la même que celle après)

  - H1 : π ≠ π’ (la fréquence de succès avant est différente que celle après)

Conditions d’utilisation : nSE + nES >10 où nSE et nES sont les cases de désaccord (ou de discordance).

 

 

6. Après et avant le χ2 : comment exploiter un tableau de contingence :

 

Possibilité d’affiner l’analyse en exploitant le tableau de contingence.

Ex de Méot (2003) :

- Lien éventuel entre l’âge et la dominance manuelle. Enfants âgés de 6, 8 et 10 ans doivent mettre des cartes sur une table. 180 enfants répartis de la manière suivante :

 

 

A partir de la distribution d’effectifs conjoints, on peut obtenir la distribution de fréquences conditionnelles.

Ex : la dominance manuelle pour les enfants de 8 ans.

Fréquences conditionnelles : fréquences des modalités d’un des caractères lorsque l’on se trouve dans une seule des modalités de l’autre (e.g. fréquence des enfants qui posent la carte avec la main droite, la main gauche ou les deux mains indifféremment pour les enfants de 8 ans).

Les fréquences associées à ce caractère (la dominance) sont conditionnées par la modalité du second caractère (l’âge de 8 ans). Noté à l’aide du signe /.

Ex : fd/8 pour dire qu’on étudie la fréquence des droitiers pour enfants de 8 ans fg/8 la fréquence des gauchers pour les enfants de 8 ans, etc.

La fréquence fd/8 est obtenue en divisant l’effectif conjoint nd/8 par l’effectif marginal n.8

 

 

7. D’autres infos à partir du χ2 :

 

Chaque case apporte une contribution au χ2 et on va pouvoir déterminer la force de cette contribution au χ2.

Dans chaque case, on pourra observer un phénomène d’attraction ou répulsion entre les modalités i et j.

Pour une case donnée :

  - Attraction entre 2 modalités si l’effectif observé est > à l effectif théorique (i.e. si l’écart est positif).

  - Répulsion si effectif observé est < effectif théorique (i.e. si écart est négatif).

  - Liaison nulle si effectif observé est = effectif théorique (i.e. si écart = 0).

Plus la valeur est importante, plus l’attraction ou la répulsion est importante.

Impossible d’interpréter la valeur des contributions au χ2 si celui-ci n’est pas significatif.

Possibilité d’exprimer les contributions de chaque case du tableau de contingence en pourcentage, en divisant la contribution d’une case au χ2 par le χ2 lui même et en multipliant le résultat par 100.

 

 

 

VI. Tests sur les moyennes.

 

 

3 comparaisons envisagées :

  - On compare une moyenne à une norme ou à une moyenne théorique.

  - On compare les moyennes de deux échantillons indépendants.

  - On compare les moyennes de deux échantillons appariés.

Le test choisi dépendra de la taille de l’échantillon.

Condition d’utilisation : normalité de la distribution (sera vérifiée en amont), égalité des variances.

 

1. Hypothèses unilatérales et bilatérales :

 

Dans une hypothèse orientée ou unilatérale, on précise le sens de la différence. Contrairement à une hypothèse bilatérale.

Hypothèse unilatérale = hypothèse orientée : les valeurs rejetées sont à droite ou à gauche de la distribution.

Hypothèse bilatérale = hypothèse non orientée : les valeurs rejetées sont situées à droite et à gauche de la distribution.

 

 

2. Comparaison d’une moyenne à une moyenne connue dans la population de référence :

 

Les hypothèses statistiques :

  - H0 : μ = μ0 est la moyenne théorique.

  - H1 : μ ≠ μ0 ou μ < μ0 ou μ > μ0 où μ0 est la moyenne théorique.

 

Deux cas de figures possibles :

  - La taille de l’échantillon est ≥ à 30 :

 

 

          + La valeur critique doit être recherchée dans la table de la loi normale (value z correspondant à une probabilité de .05 ou de .025 si hypothèse bilatérale).

          + Si σ (paramètre populationnel) n’est pas donné dans l’énoncé du problème, il faut l’estimer avec la formule corrigée de la variance.

          + Ex :

                   . Empan mnésique est généralement de 7 + ou – 2 éléments. Des chercheurs veulent vérifier si l’empan est le même chez les lycéens (in Lieury, 1992). Ils présentent 16 mots communs à 210 lycéens sur un écran de TV à un rythme d’1 mot/2 sec. Le rappel se fait immédiatement après cette présentation.

                   . Moyenne de rappel des lycéens = 6.91.

                   . Ce score est-il différent de celui observé dans les travaux antérieurs à un seuil α = .05 ?

                   . Population : μ = 7 (norme) σ = 2 (écart-type).

                   . Hypothèses statistiques :

                            - H0 : μ = 7 (pas de différence avec la moyenne théorique).

                            - H1 : μ ≠ 7 (différent de la moyenne théorique– H bi-directionnelle).

                   . Calcul de la statistique de décision :

                            - On a μ = 7, σ = 2, → X = 6.91 (moyenne de l’échantillon) et n = 210 (taille de l’échantillon).

 

 

                   . Conclusion :

                            - Valeur observée < valeur critique. H0 non rejetée au seuil α =.05.

                            - Echantillon de lycéens peut être considéré comme appartenant à la même population. Sa moyenne n’est pas significativement différente de celle de la population générale.

  - La taille de l’échantillon est ≤ à 30 :

 

 

         + La valeur critique doit être recherchée dans la table du t de Student (valeur t correspondant à une probabilité de .05 ou de .025 si l’hypothèse est bilatérale).

         + Ex :

                  . Dans les grandes entreprises, on sait que le salaire moyen des hommes possédant entre 3 et 5 ans d’expérience est de 28000 €. Les salaires (en milliers d’euros) d’un échantillon aléatoire composé de 10 femmes possédant entre 3 et 5 ans d’expérience sont les suivants : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36.

                  . Peut-on considérer au seuil =.05 que le niveau de salaire des femmes est différent du niveau de salaire des hommes ? (On cherche donc ici à comparer le salaire moyen des femmes au salaire moyen des hommes en quelque sorte considéré comme une norme).

 

 

3. Comparaison de deux moyennes μ1 et μ2 échantillons indépendants :

 

Hypothèses statistiques :

  - H0 : μ1 = μ2.

  - H1 : μ1 ≠ μ2 ou μ1 ≤ μ2μ ou μ1 ≥ μ2.

 

 

 

4. Comparaison de deux moyennes μ et μ’ d’échantillons appariés :

 

Echantillons apparies : ce sont les mêmes individus qui passent la même épreuve à deux moments différents.

On utilise les différences entre les scores pour calculer la statistique de décision. On les note D (différence). Ils représentent le degré d’amélioration ou de détérioration entre les deux moments du test.

Et on effectue une inférence sur la moyenne des différences (on compare la moyenne des différences observées à une moyenne théorique égale à 0 et on utilise z ou t suivant l’échantillon. Cf. comparaison d’une moyenne théorique à une moyenne connue dans la population de référence).

 

Hypothèses statistiques :

  - H0 = μ = μ’ (Si H0 est vraie : pas d’amélioration ou de détérioration).

  - H1=μ ≠ μ’ ou μ < μ’ ou μ > μ’

  - Une autre manière de les formuler étant :

        + H0: μd = 0 (la moyenne des différences = 0).

        + H1: μd ≠ 0 ou μd < 0 ou μd >0 la moyenne des différences ≠ 0, < 0 ou > 0).

 

 



25/01/2013
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 1519 autres membres