STATISTICA Réseaux de Neurones Automatisés



En bref...

Les réseaux de neurones constituent une méthodologie de plus en plus utilisée dans de nombreux domaines allant de la recherche fondamentale à des applications de data mining, de prévisions commerciales et gestion des risques, en production industrielle...

STATISTICA Réseaux de Neurones Automatisés (SANN) est une application de réseaux de neurones particulièrement efficace qui utilise les dernières avancées technologiques. Le programme offre de nombreux avantages et s'adresse non seulement aux utilisateurs confirmés (en mettant à leur disposition divers types de réseaux et d'algorithmes d'entraînement), mais aussi aux utilisateurs novices dans le domaine des réseaux de neurones (grâce à son outil de Recherche Automatique de Réseaux qui guide l'utilisateur dans la sélection des différentes options pour construire les réseaux de neurones).

STATISTICA Réseaux de Neurones Automatisés vous propose de nombreuses statistiques, options de représentation, architectures de réseaux et algorithmes d'apprentissage. Vous pouvez récupérer le code C ou le code PMML (Predictive Model Markup Language) de vos modèles en vue de les déployer. Le Générateur de Code C est un produit complémentaire.

Parfaitement intégré avec le système STATISTICA, ce programme offre :

  • Une sélection des architectures de réseaux les plus courantes, notamment les Perceptrons Multicouches, réseaux de Fonctions à Base Radiale, Réseaux Linéaires et Cartes Auto-Organisatrices.
  • Des algorithmes d'apprentissage ultra-performants, notamment Descente du Gradient Conjugué, BFGS, apprentissage de Kohonen, Affectation des Centres par les k-Moyennes.
  • Formation d'ensembles de réseaux pour de meilleures performances prédictives.
  • Recherche Automatique de Réseaux, un outil de sélection automatique de l'architecture et de la complexité du réseau de neurones.
  • Conservation du Meilleur Réseau en mémoire, et bien plus encore...
  • Différentes analyses statistiques et construction de modèles prédictifs intégrés, notamment pour des problématiques de régression, classification, régression chronologique, classification chronologique et clustering pour réduire les dimensions en entrée.
Le programme est servi sur CD-ROM avec un jeu de documentation.

Fonctionnalités de STATISTICA Réseaux de Neurones Automatisés

Réalisez vos analyses dans votre navigateur Internet

Sommaire

Langage de programmation Visual Basic et nombreux graphiques intégrés dans toutes les analyses.

STATISTICA Réseaux de Neurones Automatisés fonctionne sur les plates-formes Windows XP, Windows Vista et Windows 7.

Remarque : STATISTICA Réseaux de Neurones Automatisés est intégré par défaut dans le produit STATISTICA Data Miner

Description Technique

STATISTICA Réseaux de Neurones Automatisés est un programme analytique complet, performant, puissant, et extrêmement rapide de réseaux de neurones, offrant :

  • Des outils intégrés de préparation et de traitement a posteriori, notamment pour la sélection des données, le codage en valeurs nominales, la réduction et la normalisation des données, le remplacement des valeurs manquantes, ainsi qu'une aide à l'interprétation des problèmes de classification, de régression et de séries chronologiques.
  • Une utilisation intuitive alliée à une puissance analytique inégalable ; par exemple, un outil de Recherche Automatique de Réseaux (RAR) va guider l'utilisateur pas-à-pas pour créer différents réseaux de neurones et choisir le plus performant (tâche qui demande habituellement une grande expertise et une solide connaissance de la théorie sous-jacente).
  • Des algorithmes extrêmement puissants et sophistiqués (notamment Descente du Gradient Conjugué et BFGS) ; contrôle de tous les aspects qui déterminent la performance du réseau comme les fonctions d'activation et d'erreur ou la complexité du réseau.
  • La possibilité de combiner des réseaux et architectures de réseaux de taille quasiment illimitée dans des ensembles de réseaux.
  • Des résultats graphiques et statistiques complets facilitant les analyses exploratoires interactives.
  • Une parfaite intégration dans STATISTICA ; tous les résultats, graphiques, rapports... peuvent être ensuite modifiés à l'aide des outils graphiques et analytiques de STATISTICA. (par exemple, pour effectuer des analyses de prévision des résidus, ou produire des rapports de synthèse annotés...).
  • Complète intégration avec les outils d'automatisation de STATISTICA ; possibilité de générer des macros pour chacune des analyses effectuées ; de programmer des analyses ou des applications de réseaux de neurones personnalisés dans l'environnement STATISTICA Visual Basic, ou d'appeler STATISTICA Réseaux de Neurones Automatisés depuis des applications compatibles avec la technologie du Modèle Objet (COM ; par exemple, automatiser des analyses de réseaux de neurones dans une feuille de calcul MS Excel, ou intégrer une procédure de réseaux de neurones développée en C++, dans votre propre application C++, C#, Java, etc...).

Comment Aborder les Problèmes en Calcul Neuronal

L'utilisation des Réseaux de Neurones ne se limite pas à introduire des données dans le réseau de neurones.

STATISTICA Réseaux de Neurones Automatisés (SANN) va vous guider au fil des étapes clé de la conception du réseau, non seulement au travers d'Architectures de Réseaux et d'Algorithmes d'Apprentissage, mais aussi par de nouvelles approches innovantes pour créer des architectures de réseaux en utilisant des fonctions d'erreur spécifiques permettant l'iterprétation des résultats en sortie. En outre, les développeurs de logiciels et les utilisateurs travaillant avec des applications sur-mesure apprécieront, après avoir réalisé leurs expériences prototypes à l'aide de l'interface simple et intuitive de STATISTICA Réseaux de Neurones Automatisés, de pouvoir intégrer les analyses neuronales dans leur propre application en utilisant les bibliothèques STATISTICA de fonctions COM qui rendent accessibles l'intégralité des fonctionnalités du programme, ou en utilisant les langages C (C++, C#) ou Visual Basic générés par le programme pour le déploiement des réseaux entraînés.

Haut de la Page

Données d'Entrée

STATISTICA Réseaux de Neurones Automatisés est totalement intégré à STATISTICA, et vous donne donc accès à une large gamme d'outils pour l'édition (la préparation) des données disponibles pour les analyses (transformations, filtres de sélection, outils de vérification des données, etc...). Comme pour toutes les analyses STATISTICA, le programme peut être "connecté" à des bases de données distantes grâce aux outils d'interface directe avec des bases de données (IDBD), ou être lié aux données actives afin de ré-entraîner ou appliquer les modèles (par exemple, calculer les valeurs prévues ou effectuer une classification) dès que les données d'entrée sont modifiées.

Haut de la Page

Réduction des Données et Préparation des Valeurs Nominales

D'une manière générale, les données d'entrée d'un réseau doivent être préparées avec soin, et les sorties du réseau doivent être interprétés convenablement. STATISTICA Réseaux de Neurones Automatisés (SANN) permet de réduire automatiquement les données à la fois pour les entrées et les sorties, et de recoder automatiquement les variables en valeurs nominales (par exemple, Sexe={Homme,Femme}), y compris des schéma de codage (un-sur-N). STATISTICA Réseaux de Neurones Automatisés offre par ailleurs diverses méthodes pour traiter les valeurs manquantes. Des fonctions spécifiques de préparation des données et d'interprétation permettent une utilisation efficace avec les Séries Chronologiques. De nombreux outils sont également proposés dans STATISTICA.

Pour les problèmes de Classification, STATISTICA Réseaux de Neurones Automatisés va affecter les observations aux différentes classes et interpréter les sorties du réseau sous la forme de véritables probabilités. Grâce à la fonction d'activation spécialisée Softmax et aux fonctions d'erreur d'Entropie-croisée, STATISTICA Réseaux de Neurones Automatisés, offre une approche pragmatique et probabiliste de la classification.

Haut de la Page

Sélectionner un Modèle Neuronal, Ensembles de Réseaux de Neurones

L'étendue des modèles des réseaux de neurones et le nombre de paramètres à spécifier (comme la taille du réseau ou les paramètres de contrôle de l'algorithme d'apprentissage) peuvent parfois sembler déroutants (La Recherche Automatique de Réseaux (RAR) va effectuer une recherche automatique parmi différentes architectures de réseaux de complexités différentes ; voir ci-dessous). STATISTICA Réseaux de Neurones Automatisés intègre les principaux types de réseaux de neurones pour résoudre vos problèmes concrets, en particulier :

  • Perceptrons Multicouches (PMC)
  • Fonction à Base Radiale
  • Cartes Auto-Organisatrices (Kohonen)
  • Réseaux Linéaires

Vous pouvez utiliser les architectures ci-dessus pour des tâches de régression, de classification, de régression chronologique, de classification chronologique, et des analyses de clustering.

En outre, la Recherche Automatique de Réseaux permet de travailler avec des Ensembles de réseaux, issus de tout type de combinaison (dès lors qu'elles ont un sens) des différents types de réseaux ci-dessus. Vous pouvez également combiner des réseaux pour réaliser des prévisions issues de ces Ensembles dans SANN, en particulier pour les jeux de données bruités ou de petite taille.

STATISTICA Réseaux de Neurones Automatisés offre de nombreuses fonctionnalités pour aider à sélectionner l'architecture appropriée du réseau. Parmi les résultats statistiques et graphiques produits par SANN, citons notamment les histogrammes, matrices et graphiques des erreurs individuelles et globales des observations, diverses synthèses des performances de la classification et des erreurs de classement, ainsi que de diverses statistiques indispensables comme la corrélation de la régression - tous ces résultats étant bien évidemment calculés automatiquement.

Pour représenter les données, STATISTICA Réseaux de Neurones Automatisés propose divers Nuages de Points et Surfaces de Réponse en 3D, destinés à permettre à l'utilisateur de mieux comprendre le "comportement" du réseau.

Bien entendu, vous pouvez utiliser les informations issues de l'une de ces sources pour effectuer des analyses plus approfondies dans STATISTICA ou les inclure dans vos comptes-rendus, poursuivre vos analyses, ou les personnaliser.

SANN conserve automatiquement en mémoire une copie des meilleurs réseaux rencontrés lorsque vous analysez un problème, et ce réseau demeure accessible à tout moment. Vous pouvez tester automatiquement le pouvoir explicatif et la validité prédictive d'un réseau grâce à des échantillons de test et de validation, et évaluer la taille et l'efficacité du réseau ainsi que le coût des erreurs de classement.

Pour de meilleures performances, STATISTICA Réseaux de Neurones Automatisés vous offre différentes options pour personnaliser les réseaux. Vous pouvez ainsi spécifier des couches de sortie linéaires pour des réseaux utilisés dans une approche de régression (mais pas seulement), ou des fonctions d'activation softmax pour des estimations de probabilités dans le cadre de problèmes de classification. Des fonctions d'erreur d'Entropie-Croisée, basées sur les modèles issus de la Théorie de l'Information, sont également proposées, ainsi qu'une large gamme de fonctions d'activation spécialisées, notamment les fonctions Exponentielles, Tangente Hyperbolique, Logistique Sigmoïde, and Sinus, à la fois pour les neurones cachés et les neurones de sortie.

Haut de la Page

Recherche Automatique de Réseaux :
Sélection et évaluation automatique de différentes architectures

STATISTICA Réseaux de Neurones Automatisés contient également un outil de Recherche Automatique de Réseaux (RAR) qui peut traiter un très grand nombre d'architectures neuronales de différentes complexités et sélectionner le meilleur ensemble d'architectures spécifiques pour un problème donné.

Une bonne partie du temps nécessaire à la conception d'un réseau de neurones consiste à sélectionner les variables pertinentes, puis à optimiser l'architecture du réseau par une recherche heuristique. STATISTICA Réseaux de Neurones Automatisés vous permet de gagner du temps en conduisant automatiquement cette recherche heuristique pour vous. Cette recherche concerne le type de réseau, la taille et l'architecture des réseaux, les fonctions d'activation, et même les fonctions d'erreur dans certains cas.

L'outil de Recherche Automatique de Réseaux est un outil extrêmement efficace qui utilise des techniques très sophistiquées pour identifier automatiquement les meilleures architectures de réseaus. Pourquoi travailler sur un terminal pendant des heures, alors que vous pouvez laisser STATISTICA Réseaux de Neurones Automatisés faire ce travail pour vous ?

Haut de la Page

Apprentissage d'un Réseau de Neurones

Plus les types d'architectures et de réseaux vous seront familiers, plus vous regarderez avec un oeil critique la qualité et la rapidité des algorithmes d'apprentissage des réseaux. STATISTICA Réseaux de Neurones Automatisés intègre les meilleurs algorithmes d'apprentissage connus à ce jour.

STATISTICA Réseaux de Neurones Automatisés offre des algorithmes d'apprentissage rapides du deuxième ordre : Descente du Gradient Conjugué et BFGS. Une version moins "gourmande" en mémoire prend automatiquement le relai dans SANN dès que l'ordinateur atteint des limites critiques. Ces algorithmes convergent souvent beaucoup plus rapidement que des algorithmes du premier ordre comme la Descente du Gradient.

Les procédures itératives d'apprentissage contenues dans STATISTICA Réseaux de Neurones Automatisés s'accompagnent d'une évaluation systématique de l'erreur d'Apprentissage et d'une erreur de Vérification indépendante à mesure que l'apprentissage progresse. Vous pouvez interrompre l'apprentissage à tout moment en cliquant sur un bouton, et pouvez par ailleurs spécifier des Conditions d'Arrêt afin d'indiquer le moment où l'apprentissage peut prendre fin prématurément : par exemple, lorsqu'un certain niveau d'erreur est atteint, ou que l'erreur de Vérification se dégrade constamment pour un nombre d'époques donné. En cas de sur-apprentissage, pas d'inquiétude : STATISTICA Réseaux de Neurones Automatisés conserve toujours une copie du meilleur réseau rencontré, qui est automatiquement restauré et cionsidéré comme la meilleure solution. À l'issue de l'apprentissage, vous pouvez tester les performances du réseau sur les échantillons d'apprentissage, de test et de validation.

STATISTICA Réseaux de Neurones Automatisés vous offre également divers algorithmes d'apprentissage pour du Clustering, reposant sur l'algorithme de Kohonen, pour réaliser des cartes auto-organisatrices.

Haut de la Page

Exploration et Test d'un Réseau de Neurones

Après avoir entraîné un réseau, vous souhaitez le tester afin d'évaluer ses performances et explorer ses caractéristiques. STATISTICA Réseaux de Neurones Automatisés (SANN) vous offre de nombreuses fonctionnalités statistiques et graphiques.

Vous pouvez sélectionner plusieurs modèles (et ensembles). Dans ce cas, STATISTICA Réseaux de Neurones Automatisés va reporter, dans la mesure du possible, tous les résultats obtenus dans un format permettant une évaluation comparative (par exemple, en représentant les courbes de réponse des différents modèles sur un même graphique ou en reportant les prévisions issues des différents modèles dans une même feuille de données). Cette fonctionnalité permet de comparer plusieurs modèles entraînés sur un même jeu de données.

Toutes les statistiques sont produites indépendamment pour les échantillons d'apprentissage, de test et de validation ou pour toute combinaison de votre choix.

Diverses statistiques globales sont automatiquement calculées, notamment l'erreur moyenne du réseau, la matrice dite de confusion pour les problèmes de classification (qui représente les classifications correctes et incorrectes pour chacune des classes), ou la corrélation pour les problèmes de Régression. Les réseaux de Kohonen sont associés à des Cartes Topologiques, qui vous permettent d'inspecter visuellement les unités d'activations lors de l'analyse.

Haut de la Page

Solutions Packagées : Créer des Applications Personnalisées

L'interface simple et efficace de STATISTICA Réseaux de Neurones Automatisés vous permet de créer rapidement des prototypes de réseaux de neurones pour répondre à vos problématiques.

Dans certains cas, vous pouvez intégrer ces solutions dans vos propres systèmes, notamment dans des environnements de calcul plus vastes (sous forme de procédures prédéfinies intégrées dans les systèmes informatiques de l'entreprise).

Vous pouvez appliquer les réseaux de neurones entraînés sur de nouvelles données (pour des tâches de prévision) de différentes manières : vous pouvez sauvegarder les réseaux de neurones entraînés et les appliquer ensuite à de nouvelles données (pour des tâches de prévision, de classification prévue...) ; vous pouvez aussi utiliser le générateur de code (produit complémentaire facultatif) afin d'enregistrer les modèles de réseaux de neurones entraînés en langage de programmation C, prêt à compiler et que vous pouvez appeler depuis des applications ou des environnements externes, comme Visual Basic, pour déploiement et prévision sur de nouvelles données. Enfin, toutes les fonctionnalités de STATISTICA, y compris STATISTICA Réseaux de Neurones Automatisés sont accessibles par les fonctions du modèle-objet (COM - Component Object Model) depuis d'autres applications (par exemple, depuis Java, Microsoft Excel, C#, VB.NET, etc...). Par exemple, vous pouvez intégrer des analyses automatiques par STATISTICA Réseaux de Neurones Automatisés dans vos feuilles de calcul MS Excel.

Haut de la Page

Synthèse des Algorithmes d'Apprentissage

  • Descente du Gradient
  • Descente du Gradient Conjugué
  • BFGS
  • Apprentissage de Kohonen
  • Affectation des Centres par les K-Moyennes pour les réseaux à Base Radiale

Haut de la Page

Limites du Système

Les réseaux ne sont pour ainsi dire pas limités en taille (c'est-à-dire qu'ils peuvent dépasser de loin la taille habituelle ou raisonnable que vous aurez jamais l'occasion d'utiliser). La seule limite est en fait inhérente aux possibilités de votre ordinateur.

Haut de la Page

Manuel Électronique

STATISTICA Réseaux de Neurones Automatisés est accompagné d'une aide en ligne présentant les concepts des réseaux de neurones avec de nombreux exemples commentés, et un descriptif de toutes les options disponibles dans chaque boîte de dialogue.

Haut de la Page

Exemples d'Application

Les réseaux de neurones peuvent s'utiliser dans la plupart des situations où l'objectif consiste à déterminer une variable ou un attribut inconnus à partir d'observations ou de mesures connues (c'est-à-dire, diverses formes de régressions, classifications et séries chronologiques), pour lesquelles vous possédez un recul historique suffisant, et où il existe une relation ou un ensemble de relations sous-jacentes (les réseaux sont assez peu affectés par le bruit). En outre, les réseaux de neurones peuvent s'utiliser en analyse exploratoire pour mettre en évidence des clusters (réseaux de Kohonen).

Vous trouverez dans le chapitre traitant des réseaux de neurones du Manuel Électronique de Statistiques (accessible depuis le site WEB de StatSoft), une présentation complète des considérations théoriques sur les domaines d'application des réseaux de neurones. La liste ci-dessous vous donne un certain nombre d'exemples représentatifs des domaines dans lesquels les réseaux de neurones peuvent s'utiliser, mais cette liste n'est bien évidemment pas exhaustive.

  • Reconnaissance Optique des Caractères, en particulier Reconnaissance des Signatures (ainsi, une société a mis au point une machine permettant d'identifier les signatures, non seulement par l'aspect visuel, mais aussi par la pression exercée sur le stylo lors de la signature, afin de réduire les risques de fraude).
  • Traitement de l'Image (par exemple, un projet visait à mettre en place un système basé sur des images scannées des stations de métro à Londres, afin de savoir si la station était Bondée, Vide, Normalement Fréquentée, etc... et ce, indépendamment des conditions d'éclairage ou de la présence/absence de trains).
  • Prévisions Financières (par exemple, la firme américaine LBS Capital Management prétend avoir augmenté significativement ses échanges en utilisant les Perceptrons Mutli-Couches (PMC) pour prévoir l'évolution des cours boursiers).
  • Actuariat (un problème classique de scoring - décider s'il est risqué d'accorder un crédit à une personne, sur la base des informations contenues dans un questionnaire).
  • Ciblage d'un mailing (c'est-à-dire identifier les prospects qui ont le plus de chances de répondre favorablement à une action de marketing direct, en utilisant les informations contenues dans une base de données).
  • Détection et évaluation de phénomènes médicaux (par exemple, détection de crises épileptiques, estimation de la taille d'une tumeur de la prostate).
  • Maintenance des machines (par exemple, détection d'un dysfonctionnement sur une machine grâce aux vibrations ou par une signature acoustique, de sorte à pouvoir mettre en place une maintenance préventive).
  • Synthèse vocale d'un texte (par exemple, l'expérience pionnière en la matière, Nettalk, qui a appris à produire des sons, phonétiquement, à partir d'un texte écrit).
  • Prévision de Séries Chronologiques Chaotiques (un certain nombre de chercheurs ont démontré la bonne qualité des prévisions sur des données chronologiques de type chaotique).
  • Contrôle d'un Processus (par exemple, gestion des machines dans un processus de production avec ajustement continu de certains paramètres de contrôle).
  • Système d'Optimisation des Moteurs (estimation de la consommation de carburant par des capteurs, et ajustement en conséquence - une forme de contrôle de processus).
  • Analyse Linguistique (par exemple, utilisation de techniques non-supervisées afin d'identifier les mots ou phrases-clé dans des langues sud-américaines).
  • Systèmes de déclenchement en temps réel de détecteurs de Haute Énergie Physique. Les Réseaux de Neurones sont tolérants vis à vis du bruit et permettent d'établir des modèles robustes d'identification de particules physiques malgré un bruit statistique important.

Haut de la Page

Générateur de Code C - Un Produit Complémentaire

Le générateur de code source C est un produit complémentaire permettant aux utilisateurs de construire très simplement des applications personnalisées à partir des solutions produites par STATISTICA Réseaux de Neurones Automatisés (SANN). Ce produit complémentaire génère le code source du réseaux de neurones en langage C (également disponible en PMML), qui peut ensuite être compilé et intégré à vos propres programmes. Ce produit complémentaire est destiné aux développeurs et aux autres utilisateurs souhaitant convertir les solutions ultra-optimisées générées par les procédures de STATISTICA Réseaux de Neurones Automatisés, en applications fixes destinées à résoudre des problèmes analytiques routiniers. Remarque : Le générateur de Code C de SANN est un produit complémentaire payant, nécessitant une licence indépendante.

Haut de la Page

Configuration minimum :

  • Système d'exploitation : Windows XP ou ultérieur
  • RAM : 1 Go
  • Processeur : 2 GHz

Configuration recommandée :

  • Système d'exploitation : Windows XP ou ultérieur
  • RAM : 4 Go
  • Processeur : 2,0 GHz, 64 bit, double coeur
Espace disque nécessaire : 220 Mo sans les Didacticiels / 500 Mo avec les Didacticiels en anglais

Versions natives en 64-bits et versions optimisées pour les ordinateurs multiprocesseurs disponibles.

Didacticiels en anglais

N'hésitez pas à consulter notre série de didacticiels en anglais sur YouTube ou sur notre site Web. Vous trouverez des vidéo-clips décrivant pas-à-pas différentes opérations que vous pouvez réaliser à l'aide de STATISTICA. Si vous souhaitez voir aborder un thème particulier, merci de nous écrire.