Glossaire



| 2 | 3 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |

Méta Learning

Le concept du méta-learning se rencontre en data mining prédictif et permet de combiner les prévisions issues de plusieurs modèles. Il s'avère particulièrement utile lorsque les types de modèles contenus dans le projet sont très différents. Dans ce contexte, cette procédure est également appelée Stacking (Empilement Généralisé).

Supposez que votre projet de data mining contienne des arbres de classification, comme C&RT ou CHAID, des analyses discriminantes linéaires (pour un exemple, voir GDA) et des Réseaux de Neurones. Chaque modèle va calculer des classifications prévues pour un échantillon de validation croisée, sur lequel nous allons calculer des statistiques globales de qualité d'ajustement (par exemple, les taux d'erreur de classification). L'expérience a montré que nous obtenons souvent de meilleurs résultats (prévisions plus précises) en combinant les prévisions réalisées par différentes méthodes (par exemple, voir Witten et Frank, 2000). Les prévisions issues des différents modèles de classification sont utilisées en entrée d'un méta-learner, qui va alors chercher à combiner les prévisions afin d'obtenir la meilleure classification finale prévue. Ainsi, par exemple, les classifications produites par des arbres de classification, le modèle linéaire et des réseaux de neurones vont être utilisées comme variables d'entrée d'un "super-modèle de classification" par les réseaux de neurones.  Ce "super-modèle de classification" va alors chercher à "apprendre" à partir des données la manière de combiner les prévisions issues des différents modèles afin d'obtenir la meilleure classification possible (la plus juste).

Il est possible d'appliquer des méta-learners aux résultats issus des différents méta-learners et ainsi créer un "méta-méta"-learner, et ainsi de suite ; toutefois, en pratique, cette augmentation exponentielle du nombre de traitements, afin d'améliorer l'exactitude des prévisions, revêt une utilité marginale de plus en plus faible.

Voir aussi la rubrique Data Mining.