Tendance centrale et mesure de dispersion4

Présentation de données quantitatives :
TENDANCE CENTRALE
ET MESURE DE DISPERSION

Généralités
Méthode
Analyse des besoins
Assurance qualité
Evaluation
Enquête
Epidémiologie
Sciences humaines

Statistiques
Indicateurs
Ressources


Les variables en cathégories
Les mesures de tendance centrale : La moyenne - La médiane - Le mode
Les mesures de dispersion : L'étendue - La variance et la déviation standard - Ecart interquartile (EIQ)
Quelle mesure centrale avec quelle mesure de dispersion choisir?



Dans la plupart des études, le nombre de sujets est trop important pour que l'on puisse présenter les données réelles de chaque individu. C'est pourquoi, il est nécessaire de trouver un moyen qui donne le maximum d'informations possible sous le format le plus utile. Une manière courante de présentation de données est la représentation graphique ou le tableau. Les tableaux sont commodes pour présenter l'information relative aux données individuelles et les graphiques pour donner un profil général des observations. Toutefois, il est également utile de donner un résumé chiffré. Pour les variables en catégorie (niveau d'étude, sexe, absence-présence d'une maladie, statut tabagique, etc.), la mesure la plus instructive est la proportion d'individus entrant dans chaque catégorie. Les variables quantitatives (poids, taille, âge, nombre d'enfants, etc.) nécessitent quant à elle deux types de mesure pour avoir une idée complète de la distribution des observations : la mesure de la position centrale des observations et la mesure de leur dispersion, c'est-à-dire la mesure de la répartition des observations autour de cette position centrale.

LES VARIABLES EN CATHEGORIE

Les variables en catégorie sont synthétisées par des proportions et peuvent être représentées graphiquement par exemple par des "tartes".

Exemple 1 :
répartition d'une classe de 20 élèves en fonction de leur statut tabagique

Statut tabagique n %
Fumeur quotidien
Fumeur occasionnel
Non-fumeur
3
2
15
15
10
75
Représentation graphique :


Les variables en cathégories
Les mesures de tendance centrale : La moyenne - La médiane - Le mode
Les mesures de dispersion : L'étendue - La variance et la déviation standard - Ecart interquartile (EIQ)
Quelle mesure centrale avec quelle mesure de dispersion choisir?




VARIABLES QUANTITATIVES

Deux mesures sont indispensables pour décrire une variable quantitative : la mesure de la position centrale des observations et la mesure de leur dispersion.

LES MESURES DE TENDANCE CENTRALE

Il existe 3 mesures de tendance centrale : la Moyenne, la Médiane et le Mode, chacune présentant ses avantages et ses inconvénients.


1. La moyenne

La moyenne représente la mesure la plus courante de tendance centrale des observations. Elle se calcule en additionnant les valeurs observées de chaque individu divisées par le nombre de sujets observés :

Exemple 2 :

L'exemple 2 donne la taille de 5 étudiants.
La taille moyenne de ces étudiants est :


2. La médiane

La médiane correspond à l'observation du milieu, c'est-à-dire la valeur de part et d'autre de laquelle se situe la moitié des observations. Pour la mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant. La position de la médiane se calcule de manière suivante :

n = nombre de sujets observés
Si n impair :

Si n pair : moyenne arithmétique des

Dans l'exemple 2 où n est IMPAIR, la médiane est de 174 cm.
En effet, la médiane correspond à la troisième valeur : 5+1/2 = 3 et lorsqu'on classe les valeurs par ordre croissant :
171, 172, 174, 176, 177, cette valeur est 174 cm.

Dans l'exemple 3 où n est PAIR, la médiane est de 175 cm.
La médiane correspond à la moyenne arithmétique de la 3ème et 4ème valeur : 174+176/2 = 175.

En général, on préfère utiliser la moyenne à la médiane parce que la moyenne est calculée en utilisant un maximum d'informations de toutes les observations. En effet, le calcul de la moyenne fait intervenir les valeurs de toutes les observations alors que la médiane représente l'information d'une seule observation. De plus, une partie importante des tests statistiques repose sur la moyenne.
Toutefois, le désavantage de la moyenne est qu'elle est très sensible aux valeurs extrêmes alors que la médiane ne l'est pas du tout comme le montre l'exemple suivant.

Exemple 3 :
nous reprenons notre exemple 1 auquel nous rajoutons un étudiant mesurant 220 cm.

La taille moyenne de ces 6 étudiants s'élève à :

La médiane, elle, se maintient à 174 cm.

Ainsi, la moyenne n'est pas une bonne mesure lorsque les observations sont distribuées d'une manière trop asymétrique. Dans ce cas, il est préférable d'utiliser la médiane.


3. Le mode

Le mode d'une série d'observations est la valeur la plus fréquente d'un ensemble de données. Le mode est rarement employé seul pour mesurer la tendance centrale, parce qu'avec un petit nombre d'observations, comme c'est le cas dans notre exemple, chaque valeur est unique. Dans ce cas, il n'y a pas de mode.


Les variables en cathégories
Les mesures de tendance centrale : La moyenne - La médiane - Le mode
Les mesures de dispersion : L'étendue - La variance et la déviation standard - Ecart interquartile (EIQ)
Quelle mesure centrale avec quelle mesure de dispersion choisir?




VARIABLES QUANTITATIVES

MESURE DE LA DISPERTION OU DE LA VARIABILITE DES OBSERVATIONS


1. L'étendue

L'étendue mesure l'écart entre la valeur la plus élevée et la plus petite. Par exemple, l'étendue de la taille des 6 étudiants est de 220 cm - 171 cm = 49 cm. Bien qu'elle soit facile à calculer et à comprendre, cette mesure de dispersion présente un certain nombre de désavantages. Premièrement, la valeur de l'étendue a tendance à augmenter avec la taille de l'échantillon. Ensuite, puisqu'elle est calculée à partir des valeurs extrêmes, sa valeur peut être étendue même si les valeurs de la majorité des observations sont proches les unes des autres. De plus, elle est inutilisable pour les tests statistiques. On préférera donc une mesure qui tienne compte de la totalité des observations.


2. La variance et la déviation standard

Ces deux mesures représentent les mesures de variabilité les plus courantes et les plus instructives. Elles mesurent la dispersion de chaque observation autour de la moyenne. La variance se calcule d'abord en faisant la différence entre chaque observation et la moyenne . Ces différences sont ensuite élevées au carré afin que les chiffres positifs et négatifs ne s'annulent pas. On additionne ensuite ces écarts élevés au carré . La somme des carrés des écarts est alors divisée par le nombre total d'observations moins une (n-1).

ou

Exemple 4 :
en reprenant notre exemple, le calcul de la variance de la taille des 5 étudiants est :

Variance (V) : 26/(5-1)= 6,5

La déviation standard (ds) est simplement la racine carrée de la variance :
Ainsi, dans notre exemple, nous pouvons décrire la distribution de la taille en donnant la moyenne 174 ± 2,55 de déviation standard.

3. Ecart interquartile (EIQ)


L'idée est de diviser les observations, classées en ordre croissant, en 4 groupes égaux et de mesurer la distance entre les quartiles extrêmes (Q1 et Q3).

Q1 = observation telle que 25% des sujets lui sont inférieurs.
Q2 = médiane.
Q3 = observation telle que 75% des sujets lui sont inférieurs.

EIQ = Q3 - Q1


Les variables en cathégories
Les mesures de tendance centrale : La moyenne - La médiane - Le mode
Les mesures de dispersion : L'étendue - La variance et la déviation standard - Ecart interquartile (EIQ)
Quelle mesure centrale avec quelle mesure de dispersion choisir?



QUELLE MESURE CENTRALE AVEC QUELLE MESURE DE DISPERSION CHOISIR ?

Pour des distributions symétriques, la moyenne et la déviation standard constituent une information suffisante pour décrire l'ensemble des observations. Pour les distributions asymétriques, on choisira de préférence la médiane et l'étendue comme mesure de variabilité.

Le plus souvent :

  • Moyenne et déviation standard
Distribution asymétrique :
  • Médiane et EIQ


Les variables en cathégories
Les mesures de tendance centrale : La moyenne - La médiane - Le mode
Les mesures de dispersion : L'étendue - La variance et la déviation standard - Ecart interquartile (EIQ)
Quelle mesure centrale avec quelle mesure de dispersion choisir?

Rédaction @ ULB-PROMES, Christine Bazelmans, octobre 2001.
Webmaster @ CDCS.asbl

Retour au sommaire des