Glossaire
Pearson (Corrélation)
Le coefficient de corrélation le plus utilisé est le r de Pearson (Pearson, 1896), aussi appelé coefficient de corrélation linéaire (le terme corrélation a été utilisé la première fois par Galton en 1888). C'est le coefficient proposé dans le module des Statistiques Élémentaires ; l'option Coefficient de Corrélation de Pearson est accessible par la commande Corrélations du menu Statistiques - Calculateur de Probabilités. Sans utiliser un langage trop technique, le coefficient de corrélation mesure la relation linéaire ("proportionnalité") entre les valeurs de deux variables. La valeur de la corrélation (c'est-à-dire le coefficient) ne dépend pas des unités de mesures utilisées ; par exemple, la corrélation entre la taille et le poids est identique, que ces mesures soient exprimés en pouces et en livres ou en centimètres et en kilogrammes. Proportionnalité signifie relation linéaire ; ainsi la corrélation est importante si on souhaite ajuster une ligne droite (avec une pente positive [vers le haut] ou négative [vers le bas]). Cette droite est appelée droite de régression ou droite des moindres carrés, parce qu'elle est calculée pour minimiser la somme des carrés des distances de tous les points à la droite. La corrélation de Pearson suppose que les deux variables sont mesurées sur au moins une échelle d'intervalle. Le coefficient de corrélation de Pearson se calcule comme suit :
r12 = S(Yi1 - Y-barre1)*(Yi2- Y-barre2) / [S(Yi1 - Y-barre1)2*S(Yi2 - Y-barre2)2](1/2)
Voir aussi la rubrique Corrélations - Introduction.