Commentaires préliminaires
Pour mémoire
On dispose de n données sur un échantillon de mesures, résultats,
personnes, objets... Chaque donnée est constituée d'un nombre
(une variable x) ou deux (deux variables x et y). On cherche à
calculer la moyenne de ces données et la répartition de ces
données autour de la moyenne, l'écart-type.
Ces données se calculent à partir de sommes que l'on notera :
∑x = x
+x
+x
+....x
1
2
3
∑x
2
= x
2
+x
2
+x
2
+....x
1
2
3
∑xy = x
y
+x
y
+x
1
1
2
2
Moyenne
écart type / déviation standard de l'échantillon pour x :
écart type / déviation standard de la population pour x :
2
variance = s
ou
Lorsqu'on a deux variables on essaie de déduire des données une
relation entre x et y. On étudie la solution la plus simple : une relation de
type y=a+bx.
La validité de cette hypothèse est vérifiée par le calcul d'une donnée r
appelée coefficient de corrélation linéaire. Le résultat est toujours entre
–1 et +1 et on considère bon un résultat supérieur ou égal à √3/2 en
valeur absolue.
Si la régression linéaire n'est pas vérifiée on peut étudier d'autres types
de relation entre x et y, en particulier :
logarithmique : y = A + Blnx
exponentielle : y = A e
puissance : y = A x
B
inverse : y = A + B/x
quadratique : y = A + Bx +Cx
Copyright © Lexibook 2010
8. STATISTIQUES
+x
n-1
n
2
+x
2
n-1
n
y
+....x
y
+x
y
3
3
n-1
n-1
n
n
2
Bx
2
55