Commentaires préliminaires
Pour mémoire
On dispose de n données sur un échantillon de mesures, résultats, personnes, objets...
Chaque donnée est constituée d'un nombre (une variable x) ou deux (deux variables x et y).
On cherche à calculer la moyenne de ces données et la répartition de ces données autour de
la moyenne, l'écart-type.
Ces données se calculent à partir de sommes que l'on notera :
∑x = x
+x
+x
+....x
1
2
3
∑x
2
= x
2
+x
2
+x
1
2
3
∑xy = x
y
+x
y
1
1
2
2
Moyenne
écart type / déviation standard de l'échantillon pour x :
écart type / déviation standard de la population pour x :
variance V = s2 ou σ2
Lorsqu'il y a une seule variable, et que sa répartition est gaussienne (courbe en forme de cloche)
on peut effectuer des calculs de densité de probabilité, c'est-à-dire déterminer quel pourcentage de
la population se trouve entre deux valeurs limite de x.
Lorsqu'on a deux variables on essaie de déduire des données une relation entre x et y. On
étudie la solution la plus simple : une relation de type y=A+Bx.
La validité de cette hypothèse est vérifiée par le calcul d'un coefficient appelé coefficient de
corrélation linéaire. Le résultat est toujours entre –1 et +1 et on considère bon un résultat
supérieur ou égal à √3/2 en valeur absolue.
Si la régression linéaire n'est pas vérifiée on peut étudier d'autres types de relation entre x et y, en
particulier :
logarithmique : y = A + Blnx
exponentielle : y = A e
puissance : y = A x
inverse : y = A + B/x
quadratique : y = A + Bx +Cx
22
SC498FRIM1036_291_V02.indd 22
5. STATISTIQUES
+x
n-1
n
2
+....x
2
+x
2
n-1
n
+x
y
+....x
y
+x
y
3
3
n-1
n-1
n
n
Bx
B
2
18/1/16 5:29 pm