Glossaire



| 2 | 3 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |

Ignorer les Cellules Manquantes vs. Remplacement

par la Moyenne

Pour éviter de perdre des données en raison de la suppression des observations à valeurs manquantes, vous pouvez (1) remplacer les valeurs manquantes par la moyenne (toutes les valeurs manquantes d'une variable seront alors remplacées par la moyenne de cette variable) ou (2) ignorer les cellules manquantes. Ces méthodes de traitement des valeurs manquantes sont proposées dans de nombreux modules ; vous pouvez également utiliser la méthode de remplacement par la moyenne afin de "supprimer" de façon permanente les valeurs manquantes de vos données (par l'option Remplacer les valeurs manquantes du menu Données). Le remplacement par la moyenne offre des avantages, mais aussi certains inconvénients par rapport à la méthode Ignorer les cellules à VM. Son principal avantage est de produire des résultats "cohérents" (de "vraies" matrices de corrélations). Les principaux inconvénients sont les suivants :

a. Le remplacement par la moyenne diminue artificiellement la dispersion des résultats et cette diminution artificielle est proportionnelle au nombre de valeurs manquantes dans la variable (c'est-à-dire que plus il y aura de valeurs manquantes, plus nous allons ajouter artificiellement de résultats "égaux à la moyenne" dans nos données).

b. Puisqu'elle va remplacer les valeurs manquantes par des données ayant une "moyenne" créée artificiellement, la méthode de remplacement par la moyenne peut considérablement modifier les valeurs des corrélations.