Header
🠖 Proportions et Evolutions

P4 - Statistiques

Enoncé : Dans le tableau ci-dessous, on a noté le nombre de téléphones protables vendus par Johan et Mickaël.
Prix 99 159 279 389 449 529 709
John 15 16 12 8 6 4 4
Mickaël 26 22 14 12 2 2 2

  1. Déterminer les paramètres statistiques des prix de vente pour John et pour Mickaël à l'aide de la calcuatrice.
  2. Construire les diagrammes en boite des deux séries sur un même repère.
  3. Comparer les deux vendeurs.
Correction en vidéo
  • Calculer des fréquences
  • Calculer les paramètres d'une série statistique (moyenne et écart-type, médiane et écart interquartiles)
  • Construire un diagramme
  • Comparer deux séries statistiques
  • Interpréter l'écart type
On considère une série de données statistiques :
x1;...;x1n1fois;x2;...;x2n2fois;...;xk;...;xknkfois

1. Représenter une série statistique

1.1. Tableau des effectifs ou des fréquences

On peut regrouper ces données dans un tableau d'effectifs.

Valeurs x1 x2 ... xk
Effectifs n1 n2 ... nk

Pour construire le tableau des fréquences, il faut calculer les fréquences associées à chacunes des valeurs :
fréquence=effectifeffectif total
  • L'effectif total est la somme des effectifs. N=n1+n2 + ... +nk
  • La somme des fréquences est égale à 1.

1.2. Diagramme en bâtons ou diagramme circulaire

Diagramme en bâtons (ou en barres) :
  • Chaque barre correspond à une valeur de la série de données.
  • La hauteur de chaque barre donne l’effectif ou la fréquence associée à chaque catégorie.
Diagramme circulaire (ou semi-circulaire) :
  • Les angles des secteurs sont proportionnels aux effectifs de la série de données.
  • L'angle correspondant à l'effectif total est 360° pour le diagramme circulaire et 180° pour le diagramme semi-circulaire.

1.3. Histogramme et regroupement des données en classes de valeurs

2. Moyenne et écart-type

2.1. Moyenne et moyenne pondérée

Définitions :
  • Série de données brutes :
    La moyenne x¯ est la somme de toutes les données de la série statistique, divisée par l’effectif total N.
    x¯=x1+x2+...+xkN
  • Série de données avec effectifs :
    La moyenne pondérée x¯ est :
    • la somme des produits des valeurs par leurs effectifs, divisée par l’effectif total N.
      x¯=x1n1+x2n2+...+xknkN
    • la somme des produits des valeurs par leurs fréquences.        x¯=x1f1+x2f2+...+xkfk
Remarque : Pour des données regroupées en classes, on utilise le centre de chaque classe pour le calcul de la moyenne.

2.2. Variance et écart-type

Définitions :
  • La variance V d’une série statistique est la moyenne des carrés des écarts à la moyenne.
    V=(x1x¯)n1+(x2x¯)n2+...+(xkx¯)nkN
  • L’écart-type σ (se lit « sigma ») d’une série statistique est la racine carrée de la variance.  σ=V
Remarque : L’écart-type mesure la dispersion des valeurs autour de la moyenne : plus il est grand, plus les valeurs sont dispersées et moins la moyenne représente de façon significative la série.

3. Médiane et écart interquartiles

Définition : Les quartiles Q1, Q2 et Q3 d’une série statistique sont trois quantités qui partagent la liste ordonnée des données de la série en 4 sous-listes ayant à peu près le même effectif, c’est-à-dire environ 25 % des données.
  • Q1 est appelé le 1er quartile.
  • Q3 est appelé le 3ème quartile.
  • Q2 aussi noté Me, correspond à la médiane qui sépare la série ordonnée de données en deux sous-séries de même effectif.
Méthode de calcul : Pour faciliter le calcul de la médiane et des quartiles, on peut utiliser les effectifs (ou fréquences) cumulé(e)s croissant(e)s.
  • l’effectif (ou fréquence) cumulé(e) croissant(e) de la valeur xi est la somme des effectifs de toutes les valeurs de la série inférieures ou égales à xi.

  • pour le calcul de la médiane :
    • Si l’effectif total de la série est impair, la médiane est la donnée centrale de la série.
    • S’il est pair, la médiane est la moyenne des deux données centrales de la série.

  • pour le calcul des quartiles :
    • avec les effectifs cumulés croissants :
      • Q1 est la valeur associée à un effectif cumulé environ égal à 0,25×N (ou 14×N) .
      • Q3 est la valeur associée à un effectif cumulé environ égal à 0,75×N (ou 34×N) .
    • avec les fréquences cumulées croissantes :
      • Q1 est la valeur associée à une fréquence cumulée de 25 %.
      • Q3 est la valeur associée à une fréquence cumulée de 75 %.
On peut représenter ces informations dans un diagramme en boîte (ou boîte à moustaches) :

Remarque : L’intervalle interquartiles [Q1;Q3] contient environ 50% des données de la série.

Défintions : Deux paramètres statistiques permettent de mesurer la dispersion des valeurs autour de la médiane;
  • L’étendue est la différence entre le maximum et le minimum de la série statistique.
  • L’écart interquartiles est la différence entre Q1 et Q3.