Cours de psychologie

Statistiques descriptives - cours

Statistiques Descriptives

 

 

I. Organisation de données et représentation graphique.

 

 

1. Echelles :

 

Nominales : constitué de catégories ou de classes qui ne peuvent pas être ordonnées. C’est une variable qualitative et non quantitative. On s’en sert pour les catégories socio-pro, les partis politiques, les couleurs, etc.

Ordinales : les modalités d’une variable sont ordonnables et totalement ordonnée : si A<B et B<C alors A<C cependant la différence entre les modalités n’est pas la même ce qui veut dire qu’on ne peut pas quantifier la différence entre chaque point. On s’en sert pour les grades à l’armée, le niveau à l’école, etc. On parle de variable qualitative.

Intervalles : modalités de la variables sont ordonnables et totalement d’ordonnée, de plus on peut dire que la différence entre A et B est la même qu’entre C et D. c’est une échelle quantitative. On s’en sert pour l’âge, la taille, le poids, etc.

De rapport : le zéro existe, même s’il signifie l’absence de mesure. Dans le cas d’un régime il est possible de perdre 0kg. Il s’agit d’une variable qualitative.

 

2. Les arrondis :

 

Les pourcentages s’écrivent toujours avec deux décimales après la virgule.

Lorsqu’on parle d’une moyenne ça dépend de l’unité de mesure (ex : si on travaille avec des ms on ne travaille pas avec des décimales, parce que c’est trop précis, si on travaille avec des secondes, on peut mettre 3 décimales): normalement elle s’écrit toujours avec 1 chiffre après la virgule, si elle s’exprime en pourcentage ce sera avec deux chiffres après la virgule.

L’écart type s’écrit avec deux décimales.

Pour le reste ca dépend de la réflexion et de l’unité de mesure : plus l’unité de mesure est petite, moins je mets de décimales.

 

 

II. Indice de tendance centrale et de dispersion.

 

 

1. Indices de tendance centrale et de dispersion :

 

Indice de tendance centrale est utilisé pour représenter le centre de la dispersion = indice central.

Indice de dispersion : indice liés à la manière dont les indices sont dispersés, répartis autour des tendances centrales.

Mode : utilisé dans les échelles nominales. Il représente le score obtenu par le plus grand nombre de participants. C’est le point le plus élevé de la distribution.

La médiane fait abstraction de la plus part des scores, puisqu’elle ne s’intéresse pas vraiment au contenu des scores. Correspond au point sous lequel 50% des données sont distribuées lorsqu’on dispose les données en ordre numérique. La médiane n’est pas influencée par les scores extrêmes, ce qui permet parfois d’obtenir des résultats plus conformes à la réalité.


Moyenne = somme des scores / nombre total des scores. Elle est souvent notée m lorsqu’on parle de la population est x. On s’en sert lorsqu’on est sure d’être dans le cas d’une échelle d’intervalle ou de rapport. Elle est sensible aux scores extrêmes.

 

 

2. Les quantiles :

 

Concept de quantile : on peut diviser une distribution en plusieurs parties :

   - Quartile : divisée en 4.

   - Décile : divisée en 10.

   - Centile : divisée en 100, et etc.

Notion générale de quantile :

   - On parle de Nquantile.

   - Les Nquanriles sont des bornes qui vont diviser la distribution en n+1 parties d’effectifs identiques.

   - La médiane divise la distribution en deux parties d’effectif égaux.

   - Les trois quartiles Q1, Q2 et Q3 divisent la distribution en 4 parties d’effectif égaux.

   - En partant de ce principe la, les 9 déciles partagent la distribution en 10 parties égales (D5 étant la médiane).

   - Et les 99 centiles, divisent la distribution en 100 parties égales.

Calcule de quantile :

   - On multiplie l’effectif total par le numéro du quantile désiré.

   - On ajoute ½ a ce produit.
   - On divise le tout par le nombre de classes formées par le quantilage.

 


3. Rappel sur les statistiques de l’échantillon et de la population :

 

 

 

III. Standardisation de variables et loi normale.

 

 

Lorsque l’on ajoute ou retire une constate à chaque valeur on ajoute ou on retire cette même constante à la moyenne. En revanche, l’écart-type et la variance ne sont pas affectés.

Lorsque l’on multiplie ou divise chaque valeur par une constante, on multiplie ou divise la moyenne et l’écart-type par cette constante et la variance par cette constante au carré.

 

Standardisation de variables :

 

Consiste à transformer les observations afin d’obtenir une nouvelle distribution de moyenne et d’écart-type déterminés à l’avance.

Avec μ et σ correspondant à la moyenne et à l’écart-type souhaités.

La transformation en notes centrées réduites (notes z) permet l’obtention d’une distribution de moyenne = 0 et d’écart-type = 1 → cette transformation n’affecte pas la forme de la distribution.

Intérêts :

  - Permet la comparaison de notes/scores provenant de distributions différentes ne pouvant pas être comparées autrement.

  - Si distribution normale : permet détermination de probabilité.

 

 

IV. Corrélation, covariance et régression linéaire.

 

 

La covariance permet de quantifier le degré de relation entre deux variables quantitatives.

 

 

Pour neutraliser l’effet de l’unité, il faut calculer la covariance des deux variables standardisées : c’est la corrélation. Elle se calcule en divisant la covariance par le produit des écarts-types.

La corrélation est appelée le coefficient de carrélation de BRAVAIS-PEARSON :

 

 

- Les résultats sont compris entre -1 et 1. Ce sont des bornes qui correspondent à une dépendance totale entre les deux variables. Il s’agit de la force de la corrélation : plus elle s’approche des bornes et plus elle est forte.

- 0 signifie l’absence de corrélation, on parle de corrélation nulle. On parle de corrélation positive lorsque les deux variables augmentent, de corrélation négative lorsqu’une variable augmente et l’autre diminue.



22/07/2012
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 1516 autres membres