Glossaire
Machine Learning
Machine learning, théorie de l'apprentissage statistique, et autres termes similaires sont souvent utilisés en data mining pour faire référence à l'application d'algorithmes génériques d'ajustement de modèles ou de classification dans le cadre du data mining prédictif. À la différence de l'analyse des données traditionnelle, qui s'attache généralement à estimer les paramètres de la population par inférence statistique, le data mining (et le machine learning) mettent davantage l'accent sur l'exactitude de la prévision (ou de la classification prévue), sans chercher à savoir si les "modèles" ou techniques utilisés pour produire les prévisions sont interprétables ou explicables de manière simple. Les réseaux de neurones ou le méta-learning (par exemple, le boosting), constituent un bon exemple de ce type de technique, souvent utilisé en data mining prédictif. Ces méthodes vont généralement ajuster des modèles "génériques" très complexes, qui n'impliquent aucune compréhension logique ou théorique des phénomènes de causalité sous-jacents ; en revanche, ces techniques vont être en mesure de produire des prévisions ou des classifications correctes dans les échantillons de validation croisée.