Pour décrire la variabilité des données, la moyenne, la médiane, l’écart-type… sont un bon début, mais il peut être intéressant de proposer d’autres mesures.
- L’étendue : Simplement préciser le minimum et le maximum des données. La différence entre le minium et le maximum s’appelle l’étendue. Cela donne bien sur les extrêmes des données.
- L’écart type, pour l’obtenir, il faut appliquer la formule suivante :
Pour obtenir une mesure de l’écart-type il faut simplement :
- Soustraire chaque valeur de la moyenne.
- Mettre au carré cette différence pour chaque score.
- Additionner tous les scores des différences au carré et diviser par le nombre de valeurs.
- Prendre la racine carrée de cette somme.
Il faut aussi savoir que :
- L’écart-type est donc l’écart moyen à la moyenne.
- Si toutes les valeurs sont identiques, l’écart-type est égale à zéro.
- L’écart-type est fortement liés à la moyenne, donc si la moyenne est excentrée par quelques valeurs, l’écart-type va augmenter.
Coefficient de variation.
Si vous n’avez que la moyenne et l’écart-type, vous pouvez calculer le coefficient de variation qui permet d’avoir une idée de l’étendu relative des données. Le coefficient de variation se calcule en divisant la moyenne par l’écart-type. Par exemple, si la moyenne est 40 et l’écart-type de 6, le coefficient de variation est de 6/40=0.15. Cela peut permettre de comparer la variabilité de deux échantillons.
Une règle empirique.
Si les données respectent une distribution normale (en forme de cloche, avec une moyenne et médiane assez proche), alors l’écart-type permet destiner la répartition des valeurs.
- 68% des valeurs sont comprises entre la moyenne + ou – un écart-type.
- 95% des valeurs sont comprises entre la moyenne + ou – deux écart-types.
- 99% des valeurs sont comprises entre la moyenne + ou – trois écart-types.
Cela permet par exemple, de voir les valeurs à prendre en compte pour satisfaire 95% des utilisateurs.
Pour résumé, pour décrire des données, il parait intéressant d’avoir au minimum l’étendu, la moyenne, la médiane et l’écart-type. Les autres valeurs pouvant être déduites celle-ci.
Source : http://www.usablestats.com/
Petit rappel qui ne fait pas de mal ! Cela me confirme également que les calculs ne sont pas mon fort… merci Excel 😉