STATISTICA Scorecard
STATISTICA Scorecard est un logiciel clé-en-main permettant de développer, estimer et suivre des modèles de scoring, avec notamment les fonctionnalités suivantes :
- Préparation des Données
- Modélisation
- Estimation et Calibrage
- Pérennité et Suivi
Sélection des Meilleurs Prédicteurs
Le module Sélection et Filtrage des Prédicteurs permet d'éliminer les variables redondantes ou possédant un pouvoir explicatif restreint à partir de l'ensemble de caractéristiques initial. Vous pouvez créer un classement des variable sur la base de deux mesures du pouvoir prédictif global des variables : la VI (Valeur Informative) et le V de Cramer. Grâce à ces deux mesures, vous êtes en mesure d'identifier les caractéristiques qui ont un impact important sur le risque de crédit et pouvez les sélectionner pour la phase suivante de développement du modèle. En outre, l'option Variables représentatives vous permet d'identifier la redondance entre plusieurs variables numériques sans avoir à analyser la matrice de corrélation entre toutes les variables. Ce module va créer des groupes de caractéristiques corrélées entre elles à l'aide d'une analyse factorielle avec rotation des scores. Dans chaque groupe, les variables sont fortement corrélées avec un même facteur (et sont d'ailleurs souvent corrélées entre elles) ce qui permet de sélectionner aisément un nombre restreint de variables représentatives par groupe.
Construction des Attributs
Le module Construction des Attributs vous permet de préparer des profils de risque pour chaque variable. Grâce à un algorithme automatique (utilisant la méthode CHAID) ou en mode manuel, vous pouvez répartir les variables (également appelées "caractéristiques") en classes (également appelées "attributs") présentant des risques homogènes. Vous pouvez modifier manuellement les attributs initiaux pour répondre à vos critères statistiques et pratiques comme l'homogénéité des profils ou la facilité d'interprétation. Pour construire des profils de risque pertinents, des mesures statistiques du pouvoir prédictif de chaque attribut (WoE - Weight of Evidence, et VI – Valeur Informative) sont produites. La qualité du WoE peut être estimée pour chaque attribut à l'aide d'un graphique de la tendance du Weight of Evidence (WoE). Vous pouvez sauvegarder l'ensemble du processus sous forme de script XML, et le réutiliser ultérieurement dans le module de Création de Modèles de Crédit Scoring.
Création de Modèles de Crédit Scoring
Le module de Création de Modèles de Crédit Scoring permet de créer des modèles de scorecards reposant sur les attributs préparés dans le module Construction des Attributs et des modèles de régression logistique. Vous pouvez simplifier le processus de modélisation des données brutes vers du scoring en acceptant les paramètres par défaut. Les utilisateurs avancés peuvent recodifier les variables initiales en attributs (variables muettes sigma-restreintes ou WoE) et choisir l’une des méthodes suivantes pour construire leur modèle :
- Entrée ascendante,
- Élimination descendante,
- Ascendante pas-à-pas,
- Descendante pas-à-pas,
- Meilleur modèle,
- Bootstrap de tous les effets.
Lorsque le modèle est construit, un certain nombre de statistiques (par exemple, des tests AIC, BIC, LR) et de rapports (comme les variables peu importantes qui ont été éliminées) peuvent être produits. La dernière étape de ce processus est la préparation des scorecards, à l'aide d'un algorithme de régression logistique qui permet d'estimer les paramètres du modèle et les valeurs d'échelle spécifiées afin de transformer le modèle en scorecard, qui peut alors être sauvegardé sous forme de script Excel, XML ou SVB.
Modèles de Survie
Le module Modèles de Survie permet de construire des modèles de scoring grâce au Modèle de Risque Proportionnel de Cox. Vous pouvez estimer un modèle de scoring en utilisant d'autres informations concernant le moment de la défaillance (lorsque le débiteur arrête de rembourser). Ce module vous permet de calculer la probabilité de défaillance (scoring) à un moment donné (par exemple, après 6 mois, 9 mois, etc...).Inférence de Rejet
Dans certains cas, nous devons tenir compte des cas où les demandes de crédit ont été rejetées. Dans la mesure où nous ne disposons d'aucune information concernant la classe de crédit (bon ou mauvais) des dossiers rejetés, nous allons pouvoir obtenir cette information par un algorithme – la méthode des k-plus-proches-voisins. À l'issue de l'analyse, nous disposons d'un nouveau fichier de données avec toutes les informations.

Estimation du Modèle
Le module Estimation du Modèle permet d'estimer et comparer différents modèles de scorecard. Pour évaluer ces modèles, vous pouvez choisir parmi les mesures statiques suivantes (chacune avec un rapport détaillé complet)
- Valeur Informative (VI),
- Statistique de Kolmogorov - Smirnov (avec le graphique respectif),
- Coefficient de Gini,
- Divergence,
- Statistique de Hosmer - Lemeshow,
- Analyse de la Courbe ROC,
- Courbes de Lift et de Gain.
Vous pouvez également produire les rapports suivants :
- Rapport des scores finaux,
- Rapport des caractéristiques,
- Graphique des odds ratios,
- Graphique des taux de défaillance.
Sélection des Seuils
La Sélection des Seuils permet de définir la valeur optimale de scoring pour séparer les dossiers acceptés et les dossiers rejetés. Vous pouvez affiner le processus décisionnel en ajoutant un ou deux seuils supplémentaires (par exemple, les dossiers obtenant un score inférieur à 520 seront rejetés, ceux obtenant un score supérieur à 580 seront acceptés sans conditions, et ceux obtenant un score compris entre ces deux valeurs nécessiteront un examen plus approfondi avec des garanties supplémentaires). Vous pouvez définir manuellement des seuils, sur la base de l'analyse d'une courbe ROC des coûts personnalisés d'erreur de classement et de la fraction de crédit défaillant (La courbe ROC - Receiver Operating Characteristic – nous donne une mesure du pouvoir prédictif d'un modèle). Vous pouvez également déterminer des seuils optimaux en simulant le profit associé à chaque seuil. Vous pouvez ensuite estimer la pertinence des seuils sélectionnés à l'aide de différents rapports.
Scoring des Observations
Le module Scoring des Observations permet de scorer de nouvelles observations en utilisant le modèle sélectionné enregistré sous forme de script XML. Vous pouvez calculer le scoring global, des scorings partiels de chaque variable, et la probabilité de défaillance (déterminée à partir du modèle de régression logistique), ajustée par une probabilité de défaillance a priori dans la population entière.
Stabilité de la Population
Le module Stabilité de la Population offre un certain nombre d'outils analytiques pour comparer deux jeux de données (par exemple, un fichier de données actuel et un fichier de données historique) afin de détecter toute modification significative dans la structure des caractéristiques ou dans la population des emprunteurs. Toute distorsion significative dans le fichier de données actuel peut nécessiter la réestimation des paramètres du modèle. Ce module produit des rapports de la stabilité de la population et des caractéristiques avec les graphiques respectifs.