Glossaire



| 2 | 3 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |

Réduction des Données

Le terme de Réduction des Données est utilisé dans deux contextes différents :

La Réduction des Données en diminuant le nombre de dimensions (statistiques exploratoires multivariées). Cette interprétation de la Réduction des Données appartient aux méthodes analytiques (typiquement aux techniques exploratoires multivariées telles que l'Analyse Factorielle, l'Analyse de Proximité, la Classification, l'Analyse Canonique ou les Réseaux de Neurones) qui cherchent à réduire le nombre de dimensions des données par extraction d'un certain nombre de facteurs, dimensions, clusters, etc..., qui expliquent la dispersion des données (multidimensionnelles). Par exemple, dans des questionnaires mal élaborés, toutes les réponses données par les participants sur un grand nombre de variables (échelles, questions ou dimensions) pourraient être expliquées par un nombre très restreint de facteurs "triviaux" ou synthétiques. Par exemple, deux de ces facteurs pourraient révéler  : (1) l'attitude des personnes interrogées par rapport à l'étude (positive ou négative) et (2) un facteur de "désirabilité sociale" (une réponse biaisée dénotant une tendance à répondre de manière socialement désirable).

La Réduction des Données par diminution non biaisée de la taille d'échantillon (graphiques exploratoires). Ce type de Réduction des Données s'applique en analyse graphique exploratoire à un nombre considérable de données. La taille du fichier de données peut alors masquer une structure existante (particulièrement sur les graphiques curvilignes ou nuages de points) en raison de la densité des points ou courbes. Il peut alors être utile de ne représenter qu'un sous-ensemble représentatif de données (pour faire ressortir la structure) afin de mettre en évidence une structure qui sans quoi serait masquée bien que réelle.

Voir aussi la rubrique Data Mining.