Dans ce chapitre, on va compléter ce que tu as déjà vu sur les statistiques au collège.
Enjeu
A l'issue du chapitre, il faudra que tu sois capable de réaliser les calculs attendus sur une série statistiques : médianes, quartiles et moyenne, de savoir représenter une série statistiques et enfin de fournir une interprétation des valeurs trouvées dans le contexte de l'exercice proposé.
I. Effectifs et fréquences
Quand on fait des statistiques, la première chose qu'on doit faire c'est collecter des données. Celles-ci concernent un caractère (âge, taille, note, ...) d'une population d'individus. On obtient alors des valeurs brutes qu'il est parfois nécessaire de synthétiser dans des tableaux afin d'en faciliter la lecture. Ces données correspondent à une série statistique.
Exemple : Voici les notes de 50 étudiants à un examen :
Les notes étant toutes comprises entre 0 et 20 on va les regrouper dans un tableau en comptabilisant le nombre de fois ou chacune d'entre-elles apparaît.
On obtient ainsi le tableau suivant :
Notes
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Effectifs
2
1
5
1
3
3
2
3
3
1
4
1
3
1
5
1
3
3
3
1
1
On appelle effectif d'une valeur du caractère le nombre d'individus ayant cette valeur et on appelle effectif total le nombre d'individus de la population étudiée.
Pour chaque valeur, on va s'intéresser à la part de ces valeurs dans la population. La fréquence d'une valeur est donc le quotient de l'effectif de cette valeur par l'effectif total.
On a ainsi la formule : .
Ainsi, par exemple, la fréquence de la note 10 est .
Propriété
La somme des fréquences d'une série statistique est égale à 1.
On s'intéresse parfois au cumul des effectifs ou des fréquences que ce soit dans le sens croissant ou dans le sens décroissant.
On obtient alors un tableau du type :
Notes
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Effectifs
2
1
5
1
3
3
2
3
3
1
4
1
3
1
5
1
3
3
3
1
1
Effectifs
cumulés
croissants
2
3
8
9
12
15
17
20
23
24
28
29
32
33
38
39
42
45
48
49
50
Effectifs
cumulés
décroissants
50
48
47
42
41
38
35
33
30
27
26
22
21
18
17
12
11
8
5
2
1
Par exemple, pour obtenir l'effectif cumulé croissant de la note 6 on a ajouté au cumul précédent (15) l'effectif de la note (2) et on obtient ainsi 17.
Cela signifie que 17 personnes ont obtenu une note inférieure ou égale à 6.
Si on veut obtenir l'effectif cumulé décroissant de la note 12, on ajoute au cumul situé à sa droite (18) l'effectif de la note (3) et on obtient 21. Pour calculer ces cumuls, on procède de la droite vers la gauche.
Et ainsi 21 personnes ont obtenu une note supérieure ou égale à 12.
Lorsqu'on est en présence de beaucoup de valeurs, on regroupe des valeurs entre-elles afin de rendre la lecture des données plus facile mais en contrepartie on perdra, ensuite, en précision sur les calculs qu'on fera. On dit alors qu'on effectue un regroupement par classe.
Classes de notes
[0;5[
[5 ;10[
[10 ;15[
[15 ;20]
Effectifs
12
12
14
12
Pour déterminer les valeurs dans la classe [0 ;5[, on a fait le cumul des effectifs des notes comprises entre 0 et 4, l'effectif de la note 5 étant compté dans la classe suivante. Seule la dernière note 20 déroge à cette règle afin de ne pas avoir à gérer une classe [20 ;25[ qui ne pourrait contenir que la première note. On ne s'intéressera ici qu'aux classes d'amplitude constante.
Toutes ces données peuvent être représentées graphiquement.
Les notes des différents étudiants à l'aide d'un nuage de points.
Les effectifs cumulés croissants à l'aide du polygone des effectifs cumulés croissants.
Les classes sont représentées à l'aide d'histogramme.
II. Moyenne et médiane
En statistique, on peut étudier différents paramètres. La moyenne et la médiane sont des paramètres de position. On en verra un autre type dans la prochaine partie.
Au collège, il vous est déjà arrivé de calculer des moyennes en ajoutant toutes les données (des notes par exemple) et en divisant par l'effectif total (le nombre de notes).
Quand les données sont fournies dans un tableau, il faut prendre en compte les effectifs de chacune des valeurs comme on le fait avec les coefficients des notes.
Définition
On considère une série statistiques dont les effectifs respectifs sont . L'effectif total est donc .
La moyenne est alors définie par .
Si les fréquences sont alors on a aussi .
Si on reprend l'exemple du début de chapitre, la moyenne des étudiants est donc :
On peut égaler calculer une valeur approchée de cette moyenne en utilisant les classes.
Classes de notes
[0;5[
[5 ;10[
[10 ;15[
[15 ;20]
Effectifs
12
12
14
12
Centre
2,5
7,5
12,5
17,5
Le centre de la classe correspond à la moyenne des extrémités des classes et on calcule une valeur approchée de la moyenne à l'aide de cette valeur. Ainsi
Ce qu'on gagne en rapidité de calcul avec cette méthode est perdu au niveau de la précision des résultats.
Le deuxième indicateur étudié est la médiane.
Définition
La médiane d'une série statistique est la valeur qui la sépare, une fois la série ordonnée dans l'ordre croissant, en deux séries de même effectif.
Il faut faire attention à la parité de l'effectif total quand on détermine la médiane d'une série.
Exemple : En reprenant nos 50 étudiants, on peut faire deux groupes : les 25 notes les plus basses et les 25 notes les plus hautes.
Il nous donc trouver une valeur qui permette d'obtenir ces deux groupes. Pour cela on va faire la moyenne de la 25ème (la dernière note du 1er groupe) et de la 26ème note (la 1ère du second groupe).
Par conséquent, ici, la 25ème et la 26ème note sont toutes les deux égales à 10 et la médiane est donc .
Regardons ce qui se passe quand l'effectif total est impair. On considère la série suivante :
12 - 13 - 14 - 15 - 17
On a un 1er groupe constitué de 12 - 13 et un second groupe avec 14 - 17. La médiane est alors la valeur isolée, ici 14.
Remarque : Si la série n'est pas ordonnée, il faut impérativement le faire avant de déterminer la médiane.
III. Quartile et étendue
Il s'agit ici de paramètres de dispersion. Ils mesurent si une série est concentrée autour d'une valeur ou si, au contraire, elles sont « éparpillées ».
Définition
On considère une série statistique ordonnée dans l'ordre croissant.
On appelle premier quartile, noté Q1, la plus petite valeur de la série pour laquelle au moins 25% des valeurs lui sont inférieures ou égales.
On appelle troisième quartile, noté Q3, la plus petite valeur de la série pour laquelle au moins 75% des valeurs lui sont inférieures ou égales.
Remarque : Du fait de la définition, les deux quartiles appartiennent nécessairement à la série statistique étudiée.
Exemple : En reprenant notre série de notes
. Q1 correspondra donc à la 13ème valeur soit Q1=5.
. Q3 correspondra donc à la 38ème valeur soit Q3=14.
Le dernier paramètre étudié est l'étendue.
Définition
L'étendue d'une série statistique est la différence entre la plus grande et la plus petite valeur.
Ainsi dans l'exemple l'étendue vaut 20 - 0 = 20.
Publié par Prof digiSchool
le
ceci n'est qu'un extrait
Pour visualiser la totalité des cours vous devez vous inscrire / connecter (GRATUIT) Inscription Gratuitese connecter
Désolé, votre version d'Internet Explorer est plus que périmée ! Merci de le mettre à jour ou de télécharger Firefox ou Google Chrome pour utiliser le site. Votre ordinateur vous remerciera !