On peut regrouper ces données dans un tableau d'effectifs.
Valeurs
x1
x2
...
xk
Effectifs
n1
n2
...
nk
Pour construire le tableau des fréquences, il faut calculer les fréquences associées à chacunes des valeurs :
fréquence=effectifeffectiftotal
L'effectif total est la somme des effectifs. N=n1+n2+...+nk
La somme des fréquences est égale à 1.
1.2. Diagramme en bâtons ou diagramme circulaire
Diagramme en bâtons (ou en barres) :
Chaque barre correspond à une valeur de la série de données.
La hauteur de chaque barre donne l’effectif ou la fréquence associée à chaque catégorie.
Diagramme circulaire (ou semi-circulaire) :
Les angles des secteurs sont proportionnels aux effectifs de la série de données.
L'angle correspondant à l'effectif total est 360° pour le diagramme circulaire et 180° pour le diagramme semi-circulaire.
1.3. Histogramme et regroupement des données en classes de valeurs
2. Moyenne et écart-type
2.1. Moyenne et moyenne pondérée
Définitions :
Série de données brutes : La moyennex¯¯¯ est la somme de toutes
les données de la série statistique, divisée par l’effectif total N.
x¯¯¯=x1+x2+...+xkN
Série de données avec effectifs : La moyenne pondéréex¯¯¯ est :
la somme des produits des valeurs par leurs effectifs, divisée par l’effectif total N.
x¯¯¯=x1n1+x2n2+...+xknkN
la somme des produits des valeurs par leurs fréquences. x¯¯¯=x1f1+x2f2+...+xkfk
Remarque : Pour des données regroupées en classes, on utilise le centre de chaque classe pour le calcul de la moyenne.
2.2. Variance et écart-type
Définitions :
La variance V d’une série statistique est la moyenne des carrés des écarts à la moyenne.
V=(x1−x¯¯¯)n1+(x2−x¯¯¯)n2+...+(xk−x¯¯¯)nkN
L’écart-typeσ (se lit « sigma ») d’une série statistique est la racine carrée de la variance. σ=V−−√
Remarque : L’écart-type mesure la dispersion des valeurs autour de la moyenne : plus il est grand, plus les valeurs sont dispersées et moins la moyenne représente de façon significative la série.
3. Médiane et écart interquartiles
Définition : Les quartiles Q1, Q2 et Q3 d’une série statistique sont trois quantités qui partagent la liste ordonnée des données de la série en 4 sous-listes ayant à peu près le même effectif, c’est-à-dire environ 25 % des données.
Q1 est appelé le 1er quartile.
Q3 est appelé le 3ème quartile.
Q2 aussi noté Me, correspond à la médiane qui sépare la série ordonnée de données en deux sous-séries de même effectif.
Méthode de calcul : Pour faciliter le calcul de la médiane et des quartiles, on peut utiliser les effectifs (ou fréquences) cumulé(e)s croissant(e)s.
l’effectif (ou fréquence) cumulé(e) croissant(e) de la valeur xi est la somme des effectifs de toutes les valeurs de la série inférieures ou égales à xi.
pour le calcul de la médiane :
Si l’effectif total de la série est impair, la médiane est la donnée centrale de la série.
S’il est pair, la médiane est la moyenne des deux données centrales de la série.
pour le calcul des quartiles :
avec les effectifs cumulés croissants :
Q1 est la valeur associée à un effectif cumulé environ égal à 0,25×N (ou 14×N) .
Q3 est la valeur associée à un effectif cumulé environ égal à 0,75×N (ou 34×N) .
avec les fréquences cumulées croissantes :
Q1 est la valeur associée à une fréquence cumulée de 25 %.
Q3 est la valeur associée à une fréquence cumulée de 75 %.
On peut représenter ces informations dans un diagramme en boîte (ou boîte à moustaches) :
Remarque : L’intervalle interquartiles[Q1;Q3] contient environ 50% des données de la série.
Défintions : Deux paramètres statistiques permettent de mesurer la dispersion des valeurs autour de la médiane;
L’étendue est la différence entre le maximum et le minimum de la série statistique.
L’écart interquartiles est la différence entre Q1 et Q3.