STATISTICA Scorecard

STATISTICA Scorecard est un logiciel clé-en-main permettant de développer, estimer et suivre des modèles de scoring, avec notamment les fonctionnalités suivantes :


Sélection des Meilleurs Prédicteurs

Le module Sélection et Filtrage des Prédicteurs permet d'éliminer les variables redondantes ou possédant un pouvoir explicatif restreint à partir de l'ensemble de caractéristiques initial. Vous pouvez créer un classement des variable sur la base de deux mesures du pouvoir prédictif global des variables : la VI (Valeur Informative) et le V de Cramer. Grâce à ces deux mesures, vous êtes en mesure d'identifier les caractéristiques qui ont un impact important sur le risque de crédit et pouvez les sélectionner pour la phase suivante de développement du modèle. En outre, l'option Variables représentatives vous permet d'identifier la redondance entre plusieurs variables numériques sans avoir à analyser la matrice de corrélation entre toutes les variables. Ce module va créer des groupes de caractéristiques corrélées entre elles à l'aide d'une analyse factorielle avec rotation des scores. Dans chaque groupe, les variables sont fortement corrélées avec un même facteur (et sont d'ailleurs souvent corrélées entre elles) ce qui permet de sélectionner aisément un nombre restreint de variables représentatives par groupe.

STATISTICA Credit Scorecard Builder

Construction des Attributs

Le module Construction des Attributs vous permet de préparer des profils de risque pour chaque variable. Grâce à un algorithme automatique (utilisant la méthode CHAID) ou en mode manuel, vous pouvez répartir les variables (également appelées "caractéristiques") en classes (également appelées "attributs") présentant des risques homogènes. Vous pouvez modifier manuellement les attributs initiaux pour répondre à vos critères statistiques et pratiques comme l'homogénéité des profils ou la facilité d'interprétation. Pour construire des profils de risque pertinents, des mesures statistiques du pouvoir prédictif de chaque attribut (WoE - Weight of Evidence, et VI – Valeur Informative) sont produites. La qualité du WoE peut être estimée pour chaque attribut à l'aide d'un graphique de la tendance du Weight of Evidence (WoE). Vous pouvez sauvegarder l'ensemble du processus sous forme de script XML, et le réutiliser ultérieurement dans le module de Création de Modèles de Crédit Scoring.

Création de Modèles de Crédit Scoring

Le module de Création de Modèles de Crédit Scoring permet de créer des modèles de scorecards reposant sur les attributs préparés dans le module Construction des Attributs et des modèles de régression logistique. Vous pouvez simplifier le processus de modélisation des données brutes vers du scoring en acceptant les paramètres par défaut. Les utilisateurs avancés peuvent recodifier les variables initiales en attributs (variables muettes sigma-restreintes ou WoE) et choisir l’une des méthodes suivantes pour construire leur modèle :

  • Entrée ascendante,
  • Élimination descendante,
  • Ascendante pas-à-pas,
  • Descendante pas-à-pas,
  • Meilleur modèle,
  • Bootstrap de tous les effets.

STATISTICA Credit Scorecard Builder3

Lorsque le modèle est construit, un certain nombre de statistiques (par exemple, des tests AIC, BIC, LR) et de rapports (comme les variables peu importantes qui ont été éliminées) peuvent être produits. La dernière étape de ce processus est la préparation des scorecards, à l'aide d'un algorithme de régression logistique qui permet d'estimer les paramètres du modèle et les valeurs d'échelle spécifiées afin de transformer le modèle en scorecard, qui peut alors être sauvegardé sous forme de script Excel, XML ou SVB.

Modèles de Survie

Le module Modèles de Survie permet de construire des modèles de scoring grâce au Modèle de Risque Proportionnel de Cox. Vous pouvez estimer un modèle de scoring en utilisant d'autres informations concernant le moment de la défaillance (lorsque le débiteur arrête de rembourser). Ce module vous permet de calculer la probabilité de défaillance (scoring) à un moment donné (par exemple, après 6 mois, 9 mois, etc...).


Inférence de Rejet

Dans certains cas, nous devons tenir compte des cas où les demandes de crédit ont été rejetées. Dans la mesure où nous ne disposons d'aucune information concernant la classe de crédit (bon ou mauvais) des dossiers rejetés, nous allons pouvoir obtenir cette information par un algorithme – la méthode des k-plus-proches-voisins. À l'issue de l'analyse, nous disposons d'un nouveau fichier de données avec toutes les informations.

STATISTICA Credit Scorecard Builder4


Estimation du Modèle

Le module Estimation du Modèle permet d'estimer et comparer différents modèles de scorecard. Pour évaluer ces modèles, vous pouvez choisir parmi les mesures statiques suivantes (chacune avec un rapport détaillé complet)

  • Valeur Informative (VI),
  • Statistique de Kolmogorov - Smirnov (avec le graphique respectif),
  • Coefficient de Gini,
  • Divergence,
  • Statistique de Hosmer - Lemeshow,
  • Analyse de la Courbe ROC,
  • Courbes de Lift et de Gain.

STATISTICA Credit Scorecard Builder 5

Vous pouvez également produire les rapports suivants :

  • Rapport des scores finaux,
  • Rapport des caractéristiques,
  • Graphique des odds ratios,
  • Graphique des taux de défaillance.

Sélection des Seuils

La Sélection des Seuils permet de définir la valeur optimale de scoring pour séparer les dossiers acceptés et les dossiers rejetés. Vous pouvez affiner le processus décisionnel en ajoutant un ou deux seuils supplémentaires (par exemple, les dossiers obtenant un score inférieur à 520 seront rejetés, ceux obtenant un score supérieur à 580 seront acceptés sans conditions, et ceux obtenant un score compris entre ces deux valeurs nécessiteront un examen plus approfondi avec des garanties supplémentaires). Vous pouvez définir manuellement des seuils, sur la base de l'analyse d'une courbe ROC des coûts personnalisés d'erreur de classement et de la fraction de crédit défaillant (La courbe ROC - Receiver Operating Characteristic – nous donne une mesure du pouvoir prédictif d'un modèle). Vous pouvez également déterminer des seuils optimaux en simulant le profit associé à chaque seuil. Vous pouvez ensuite estimer la pertinence des seuils sélectionnés à l'aide de différents rapports.

STATISTICA Credit Scorecard Builder 6


Scoring des Observations

Le module Scoring des Observations permet de scorer de nouvelles observations en utilisant le modèle sélectionné enregistré sous forme de script XML. Vous pouvez calculer le scoring global, des scorings partiels de chaque variable, et la probabilité de défaillance (déterminée à partir du modèle de régression logistique), ajustée par une probabilité de défaillance a priori dans la population entière.


Stabilité de la Population

Le module Stabilité de la Population offre un certain nombre d'outils analytiques pour comparer deux jeux de données (par exemple, un fichier de données actuel et un fichier de données historique) afin de détecter toute modification significative dans la structure des caractéristiques ou dans la population des emprunteurs. Toute distorsion significative dans le fichier de données actuel peut nécessiter la réestimation des paramètres du modèle. Ce module produit des rapports de la stabilité de la population et des caractéristiques avec les graphiques respectifs.