STATISTICA Base
est un produit convivial mettant à votre disposition
l'ensemble des statistiques les plus essentielles avec diverses
fonctionnalités de gestion des résultats et
d'intégration avec le Web ; le programme offre
également l'ensemble de la palette graphique de STATISTICA
ainsi qu'un environnement de développement complet en Visual
Basic.
Le programme est servi sur CD-ROM avec un jeu de documentation.
Fonctionnalités
de
STATISTICA Base
STATISTICA
Base offre une gamme complète de statistiques
indispensables dans un logiciel convivial alliant la performance, la
puissance et la facilité d'utilisation des produits de la
gamme STATISTICA.
STATISTICA Base fonctionne sur les
plates-formes Windows XP, Windows Vista et Windows 7. Ce produit est
constitué des modules suivants :
STATISTIQUES
DESCRIPTIVES, DÉCOMPOSITIONS ET ANALYSE EXPLORATOIRE DES
DONNÉES. STATISTICA Base vous
propose une large gamme de méthodes pour réaliser
vos analyses exploratoires :
Statistiques Descriptives et Graphiques.
Le programme calcule les statistiques descriptives les plus courantes
et généralistes comme les médianes,
modes, quartiles, centiles personnalisés, moyennes et
écarts-types, intervalles inter-quartiles, limites de
confiance autour de la moyenne, asymétries et aplatissements
(avec leurs erreurs-types respectives), moyennes harmoniques et
géométriques, ainsi que de nombreuses
statistiques descriptives et diagnostiques
spécialisés. Comme dans tous les modules de STATISTICA,
de nombreux graphiques vous aident lors de la phase exploratoire de vos
analyses, par exemple, divers types de boîtes à
moustaches, histogrammes, histogrammes bivariés (en 3D ou
catégorisés), nuages de points en 2D et 3D avec
représentation différenciée de
catégories, tracés de normalité
(droite de Henry, normalité par moitié,
écarts à la normalité),
tracés Q-Q, tracés P-P,
etc... Différents tests sont proposés pour
vérifier la normalité de vos données
(tests de Kolmogorov-Smirnov, Lilliefors et Shapiro-Wilk ; vous pouvez
toutefois tester l'ajustement de nombreuses autres distributions ; voir
aussi le descriptif du module Analyse
de Processus ainsi que le paragraphe concernant
l'ajustement dans les Graphiques).
Analyses
par Groupe (Décompositions). La plupart des
statistiques descriptives et graphiques de synthèse peuvent
être calculés pour des données
catégorisées (décomposées)
selon une ou plusieurs variables de classement. Par exemple, quelques
clics de souris vous permettent de décomposer vos
données en fonction du Sexe et de l'Âge
et de visualiser les représentations
catégorisées sous forme d'histogrammes, de
boîtes à moustaches, de tracés de
normalité, de nuages de points, etc... Si vous
sélectionnez plus de deux variables
(catégorielles) de classement, des cascades
de graphiques seront automatiquement produites. Des options vous
permettent de catégoriser vos données selon des
variables continues ; par exemple, vous pouvez ventiler cette variable
continue en un certain nombre de classes, ou utiliser l'une des options
de recodification pour définir la manière dont la
variable sera recodifiée (vous pouvez spécifier
des options de catégorisation d'une complexité
quasi-illimitée, pouvant faire intervenir toutes les
variables de votre fichier de données, et ce, à
tout moment). En outre, une procédure
spécialisée de décomposition
hiérarchique permet à l'utilisateur de
catégoriser ses données en spécifiant
jusqu'à six variables catégorielles, et de tracer
toute une gamme de graphiques ou calculer de nombreuses statistiques
descriptives et matrices de corrélations pour
chaque catégorie (l'utilisateur peut, de
façon interactive, ignorer certains facteurs de la table de
décomposition complète, et ne visualiser les
statistiques que pour certains des tableaux marginaux). De nombreuses
options de mise en forme et d'étiquetage permettent
à l'utilisateur de produire des tableaux et comptes-rendus
de qualité, avec les noms et descriptions
détaillées des variables. Remarque : vous pouvez
spécifier des plans très importants pour la
procédure de décomposition (par exemple, 100.000
groupes pour une seule variable de classement), et les
résultats contiennent toutes les statistiques
appropriées de l'ANOVA (notamment le tableau complet de
l'ANOVA, des tests d'hypothèses comme le test
d'homogénéité des variances de Levene,
sept tests post-hoc, etc...). Comme dans tous les
autres modules de STATISTICA, les calculs sont
effectués en précision étendue (la "quadruple"
précision, à chaque fois que c'est possible) afin
de produire les résultats avec un niveau de
précision sans égal (voir la section sur la Précision).
La nature interactive du programme rend l'analyse exploratoire des
données très simple. Par exemple, vous pouvez
produire des graphiques exploratoires directement depuis les feuilles
de données en pointant simplement avec la souris une cellule
ou un groupe de cellules spécifiques. Des cascades
de graphiques même complexes (par exemple,
catégorisation multiple) peuvent être
créées d'un seul clic et affichés sous
forme de diaporama. Outre les nombreux graphiques statistiques
prédéfinis, vous avez à votre
disposition quantité de graphiques pour
représenter vos données brutes, statistiques de
synthèse, relations entre vos statistiques. Toutes les
techniques graphiques exploratoires (décrites dans la
section sur les Graphiques)
sont intégrées aux statistiques pour simplifier
l'analyse graphique de vos données (par exemple, suppression
interactive des points atypiques, sélection de
sous-ensembles, lissage, fonction d'ajustement, options extensives
d'habillage/balayage permettant à l'utilisateur d'identifier
et/ou d'extraire simplement les données
sélectionnées, etc...). Voir aussi la section sur
les Statistiques de Blocs,
ci-dessous.
CORRÉLATIONS. Diverses options vous
permettent d'étudier les corrélations entre vos
variables. Les mesures d'association les plus courantes peuvent
être calculées, notamment le r
de Pearson, le R des rangs de Spearman, le
tau (b, c) de Kendall,
le Gamma, le rtétrachorique,
le Phi, le V de Cramer, le
coefficient de contingence C, le D
de Sommer, les coefficients d'incertitude, les corrélations
partielles et semi-partielles, les autocorrélations,
diverses mesures de distances, etc... (des régressions
non-linéaires, ou sur des données
censurées et autres mesures
spécialisées de corrélations sont
proposées dans les modules Estimation
Non-Linéaire, Analyse de Survie,
ainsi que dans d'autres modules du produit complémentaire STATISTICA Statistiques
Avancées). Vous pouvez calculer des
matrices de corrélation avec diverses options de traitement
des valeurs manquantes : vous pouvez ignorer les cellules à
valeurs manquante, ignorer toute observation contenant au moins une
valeur manquante, ou remplacer les valeurs manquantes par la moyenne de
la variable respective. Comme dans tous les autres modules de STATISTICA,
les calculs sont réalisés en précision
étendue (la "quadruple"précision,
à chaque fois que c'est possible) afin d'obtenir des
résultats aussi précis que possible (voir la
section sur la Précision).
Comme tous les autres résultats de STATISTICA,
les matrices de corrélations sont affichées dans
des feuilles de données, vous offrant diverses options de
mise en forme (voir ci-dessous) et de représentation des
résultats numériques ; vous pouvez ainsi cliquer
sur une corrélation particulière dans la feuille
de données et choisir de représenter ce
coefficient grâce à l'un des nombreux "graphiques
de synthèse" disponibles (par exemple, un nuage de points
avec des intervalles de confiance, divers histogrammes
bivariés en 3D, des tracés de
probabilité, etc...).
Balayage et détection des points
atypiques. L'outil de balayage dans les
nuages de points permet à l'utilisateur de
sélectionner/désélectionner des points
individuels dans le tracé pour mesurer leur influence sur la
droite de régression (ou sur la courbe d'ajustement).
Formats d'affichage des nombres.
Divers formats globaux d'affichage sont proposés pour les
corrélations ; les coefficients de corrélation
significatifs peuvent apparaître en surbrillance
automatiquement, et chaque cellule de la feuille de données
peut reporter les n et niveaux p,
ou encore, vous pouvez demander les résultats
détaillés avec toutes les statistiques
descriptives (moyennes et écarts-types par couples,
pondérations B, ordonnées à l'origine,
etc...). Comme pour tous les autres résultats
numériques, les matrices de corrélations sont
affichées dans des feuilles de données offrant
des options de zoom et d'affichage/mise en forme interactifs (par
exemple, changer +.4 en +.41358927645193)
; vous pouvez donc compacter de grandes matrices (soit en utilisant le
zoom, soit en modifiant la largeur des colonnes à l'aide de
la souris pour des colonnes individuelles, ou en utilisant un bouton de
la barre d'outils pour modifier la largeur de toutes les colonnes) afin
de faciliter l'identification visuelle des coefficients
dépassant un certain niveau personnalisé, ou un
seuil de significativité (par exemple, les cellules
respectives peuvent apparaître en rouge dans la feuille de
données).
Nuage de points, nuages matriciels,
analyses par groupes. Comme dans toutes les boîtes
de dialogue de résultats, de nombreuses options graphiques
globales vous permettent de poursuivre l'analyse des relations entre
les variables, comme par exemple divers nuages de points en 2D et 3D
(avec ou sans les noms d'observations) destinés à
identifier la structure des relations entre des séries de
variables ou catégories d'observations. Les matrices de
corrélations peuvent être calculées en
fonction des variables de classement et
représentées dans des nuages de points
catégorisés. En outre, vous pouvez produire des
"décompositions de matrices de corrélations" (une
matrice par catégorie), qui seront affichées dans
des feuilles de données distinctes, et qui pourront
être enregistrées sous forme de matrices de
corrélations empilées (que vous pourrez ensuite
utiliser par exemple en entrée d'une nouvelle analyse dans
le module Modélisation
d'Équations Structurelles et Analyse de Causalité
[SEPATH] proposé dans le produit
complémentaire STATISTICA
Statistiques Avancées). Vous pouvez
synthétiser une matrice de corrélations
entière dans un même graphique grâce
à l'option Nuage de points matriciel
(avec une densité quasi-illimitée) ; vous pouvez
examiner de larges matrices de nuages de points de façon
interactive en "zoomant"sur des sections
spécifiques du graphique (ou en utilisant les barres de
défilement en mode zoom [voir l'illustration ci-contre]).
Vous pouvez également produire des nuages de points
matriciels catégorisés (un tracé
matriciel par catégorie). Vous avez par ailleurs la
possibilité de tracer des nuages de points matriciels multi-groupes,
chaque catégorie distincte (par exemple, définie
selon les modalités d'une variable de classement ou par des
filtres de sélection d'une complexité
quasi-illimitée) étant
représentée par un symbole de points
différent. D'autres méthodes graphiques peuvent
être utilisées pour représenter des
matrices de corrélations et rechercher des structures
globales (par exemple, courbes d'isoréponse, surfaces non
lissées, tracés de figures, etc...). Toutes ces
opérations peuvent être
réalisées en quelques clics et divers raccourcis
permettent de simplifier le paramétrage des analyses ; vous
pouvez afficher simultanément autant de feuilles de
données et de graphiques que vous le souhaitez, ce qui
permet de comparer les résultats et réaliser des
analyses exploratoires interactives de façon
extrêmement simple.
STATISTIQUES
ÉLÉMENTAIRES SUR DES TABLEAUX DE
RÉSULTATS (FEUILLES DE DONNÉES). STATISTICA
est un système analytique intégré qui
affiche tous ses résultats numériques sous la
forme de feuilles de données utilisables directement (sans
aucune modification) en entrée d'autres analyses. Vous
pouvez ainsi produire des statistiques
élémentaires (ou tout autre type d'analyse
statistique) à partir des tableaux de résultats
d'une analyse précédente ; vous pouvez par
exemple calculer très rapidement un tableau de moyennes sur
2000 variables, puis utiliser ce tableau comme fichier
d'entrée pour analyser la distribution de ces moyennes selon
les variables. Les statistiques élémentaires sont
donc accessibles à tout moment d'une analyse, et peuvent
être calculées sur toute type de
résultat.
Statistiques
de Blocs. Outre les statistiques descriptives que vous pouvez
calculer sur chaque feuille de données, vous pouvez mettre
des blocs de cellules numériques en surbrillance dans une
feuille de données, et produire rapidement un certain nombre
de graphiques et de statistiques descriptives sur ce bloc
sélectionné (sous-ensemble de données)
uniquement. Par exemple, si vous avez produit une feuille de
données avec les caractéristiques de tendance
centrale de 2000 variables (par exemple, avec les moyennes, modes,
médianes, moyennes géométriques et
harmoniques) ; vous pouvez mettre un bloc en surbrillance, disons de
200 variables avec uniquement les moyennes et les médianes,
puis produire un graphique curviligne multiple de ces deux mesures pour
les 200 variables sélectionnées. Vous pouvez
réaliser des analyses statistiques sur des blocs de lignes
ou de colonnes ; par exemple, vous pouviez
également produire un tracé curviligne d'un
groupe de variables en fonction de différentes
caractéristiques de tendance centrale. Pour
résumer, les statistiques de blocs vous permettent de
produire des statistiques et graphiques statistiques à
partir de valeurs arbitrairement sélectionnées
(mises en surbrillance) dans votre feuille de données
(données d'entrée ou résultats
d'analyses).
CALCULATEUR
INTERACTIF DE PROBABILITÉS. Un Calculateur
de Probabilités interactif est accessible depuis
toutes les barres d'outils. Il vous propose une large gamme de
distributions (en particulier Bêta, Cauchy,
Chi2, Exponentielle,
Valeur Extrême, F,
Gamma, Laplace, Log-normale,
Logistique, Pareto, Rayleigh,
t (Student), Weibull, et Z
(Normale)) ; la mise à jour interactive des
graphiques dans cette boîte de dialogue (tracé des
fonctions de répartition et de densité) permet
à l'utilisateur de visualiser ces distributions en utilisant
les micro-défilements "intelligents" de
STATISTICA qui permettent à
l'utilisateur d'augmenter la dernière décimale
significative (en appuyant sur le bouton GAUCHE de la souris) ou
l'avant-dernière (en appuyant sur le bouton DROIT de la
souris). Diverses options vous permettent de produire des graphiques
composés et personnalisables de distributions avec des
seuils spécifiques. Ce calculateur de
probabilités vous permet donc d'explorer de façon
interactive les distributions (par exemple, les probabilités
respectives associées à différents
paramètres de dispersion (forme)).
Tests
T et autres Tests
d'Homogénéité entre des Groupes.
Vous pouvez calculer des tests t pour des
échantillons appariés ou indépendants,
comparer des valeurs à un standard (par exemple,
tester des moyennes par rapport à une constante
particulière) ou encore des tests multivariés T2 de Hotelling (voir aussi le module ANOVA/MANOVA
et le module GLM
(Modèle Linéaire Général)
proposé dans le produit complémentaire STATISTICA Statistiques
Avancées. Diverses options vous
permettent de comparer aisément vos variables (par exemple,
vous pouvez traiter différentes colonnes de votre feuille de
données comme des échantillons distincts) et vos
groupes (par exemple, si vos données contiennent une
variable catégorielle de classement représerntant
par exemple le Sexe, et permettant d'identifier à quel
groupe chaque observation appartient). Par exemple, après un
test t pour des échantillons
indépendants, vous pouvez calculer des tests t
avec une estimation séparée des variances, le
test d'homogénéité des variances de
Levene, divers histogrammes catégorisés,
boîtes à moustaches, tracés de
probabilités, ou nuages de points
catégorisés, etc... D'autres tests
d'homogénéité (plus
spécialisés) sont proposés dans des
modules spécifiques (par exemple, Tests
Non-Paramétriques (voir ci-dessous), ou
encore Analyse
de Survie et Fiabilité/Analyse
d'Échelle (tous deux proposés
dans le produit complémentaire STATISTICA Statistiques
Avancées).
TABLES DE
FRÉQUENCES, TRIS CROISÉS, ANALYSE DE
RÉPONSES MULTIPLES. Diverses
fonctionnalités vous permettent de croiser des variables
continues, catégorielles, et à
réponses ou dichotomies multiples. De nombreuses options
vous permettent de contrôler la mise en forme et le format
des tableaux. Ainsi, pour des tableaux avec des variables de
réponses ou dichotomies multiples, les effectifs marginaux
et pourcentages peuvent être calculés à
partir du nombre total de répondants ou de
réponses, les variables à réponses
multiples peuvent être traitées par couples, et
vous pouvez comptabiliser (ou ignorer) les valeurs manquantes de
diverses manières. Les tables de fréquences
peuvent également être calculées en
utilisant des filtres de sélection logiques (d'une
complexité quasi-illimitée, utilisant toute
variable du fichier de données) pour affecter les
observations à des catégories du tableau. Tous
les tableaux peuvent être personnalisés et mis en
forme (habillés) pour produire des comptes-rendus de
qualité. Par exemple, des tableaux "de synthèse
à plusieurs entrées" peuvent être
produits avec une organisation hiérarchique des facteurs ;
dans les tableaux croisés, vous pouvez reporter le
pourcentage de chaque cellule par rapport au total en ligne, en colonne
ou à l'effectif total ; vous pouvez utiliser des
étiquettes pour décrire les catégories
de votre tableau, ou encore mettre les effectifs supérieurs
à un certain seuil en surbrillance dans le tableau, etc...
Le programme peut reporter les effectifs cumulés et
relatifs, les effectifs transformés Logit et Probit, les
effectifs normaux théoriques (ainsi que les tests de
Kolmogorov-Smirnov, Lilliefors et Shapiro-Wilk), les effectifs
théoriques et les résidus dans les tableaux
croisés, etc... Divers tests statistiques vous sont
proposés pour les tableaux croisés, notamment les
tests du Chi2 de Pearson, du
Maximum de Vraisemblance et de Yates (corrigé), le Chi2
de McNemar, le test exact de Fisher
(unilatéral et bilatéral), le Phi,
et le r tétrachorique ; ou encore le tau
(a, b) de
Kendall, Gamma, r de Spearman, D
de Sommer, coefficients d'incertitude, etc...
Graphiques. Diverses options
graphiques vous sont également proposées, en
particulier des histogrammes simples, catégorisés
(multiples), ou en 3D, des histogrammes croisés (pour chaque
"section"d'un tableau
élémentaire, à double
entrée, ou d'ordre multiple), ainsi que de nombreux autres
graphiques, y compris un "tracé d'interaction des effectifs"qui synthétise les effectifs d'un tableau
croisé complexe (sur le même principe que les
tracés de moyennes dans l'ANOVA). Vous pouvez visualiser des
cascades de graphiques même
complexes (par exemple, catégorisation multiple, ou
interactions) de façon interactive. Voir aussi la section
sur les Statistiques de Blocs,
ci-dessus, et la description des modules Analyse
Log-Linéaire et Analyse
des Correspondances (tous deux proposés
dans le produit complémentaire STATISTICA Statistiques
Avancées).
RÉGRESSION
MULTIPLE. Le module Régression Multiple
propose diverses techniques de régression
linéaire, en particulier des régressions simples,
multiples, pas-à-pas (ascendante, descendante, ou par
blocs), hiérarchiques, non-linéaires (en
particulier polynomiale, exponentielle, logarithmique, etc...), des
régressions Ridge, avec ou sans ordonnée
à l'origine (c'est-à-dire passant ou non par
l'origine), et modèles de moindres carrés
pondérés ; d'autres méthodes
avancées sont proposées dans le module Modèles
Généraux de Régression (GRM)
(par exemple, recherche exhaustive du meilleur modèle,
régression pas-à-pas multivariée pour
plusieurs variables dépendantes, avec des modèles
pouvant comporter des effets de facteurs catégoriels ;
synthèse statistique des échantillons
utilisés pour la validation et la prévision,
hypothèses personnalisées, etc...). Le module Régression
Multiple permet de calculer divers diagnostiques et
statistiques, notamment la table complète de la
régression (y compris les erreurs-types de B, Bêta
et de l'ordonnée à l'origine, le R2
et le R2 ajusté
pour les modèles avec ou sans ordonnée
à l'origine et la table ANOVA de la régression),
la matrice des corrélations partielles, les
corrélations et covariances des coefficients de
régression, la matrice sweep (inverse), le d
de Durbin-Watson, les distances de Mahalanobis et de Cook, les
intervalles de confiance autour des valeurs prévues , etc...
Valeurs prévues et
résidus. De nombreux tracés tels que
nuages de points, histogrammes, tracés de
normalité (droite de Henry, normalité par
moitié, écarts à la
normalité), tracés de corrélations
partielles, etc..., vous permettent de poursuivre l'analyse des
résidus et des points atypiques plus avant. Les
résultats de chaque observation peuvent être
représentés graphiquement à l'aide des
tracés exploratoires de figures et autres graphiques
multidimensionnels intégrés, accessibles
directement depuis les feuilles de données. Les
résidus et les valeurs prévues peuvent
être automatiquement ajoutées au fichier de
données. Une routine de prévision permet
à l'utilisateur d'effectuer des analyses conditionnelles,
et de calculer de façon interactive les valeurs
prévues pour des valeurs spécifiques des
prédicteurs.
Analyses par Groupes ; procédures
associées. D'autres procédures de
régression permettent de traiter des modèles
extrêmement importants. Une option vous permet de
réaliser des régressions multiples
décomposées selon une ou plusieurs variables
catégorielles (régression multiple par groupe) ;
d'autres procédures permettent encore de traiter des
modèles avec plusieurs milliers de variables, de calculer
des régressions par les Moindres Carrés
à deux Étapes, ainsi que des
transformations Box-Cox et Box-Tidwell
avec des graphiques. Le produit complémentaire STATISTICA Statistiques
Avancées, contient également
divers modules généraux d'estimation
non-linéaire (Estimation
Non-Linéaire, Modèles
Linéaires/Non-Linéaires
Généralisés (GLZ),
Modèles
Généraux PLS) qui permettant
d'estimer pratiquement tout type de modèle
non-linéaire personnalisé, en particulier Logit,
Probit, etc... Ce produit complémentaire contient
également un module généraliste de Modélisation
d'Équations Structurelles et d'Analyse de
Causalité (SEPATH),
qui vous permet d'analyser des matrices de corrélations, de
covariance ou des moments, très importantes (pour des
modèles avec ordonnée à l'origine).
TESTS
NON-PARAMÉTRIQUES. Le module Tests
Non-Paramétriques contient toute une gamme de
statistiques descriptives et inférentielles, avec les tests
les plus courants et certaines procédures
spéciales. Parmi les procédures statistiques
disponibles, citons le test des séries de Wald-Wolfowitz, le
test U de Mann-Whitney (avec les
probabilités exactes [et non les approximations Z]
pour les petits échantillons), les tests de
Kolmogorov-Smirnov, le test de Wilcoxon pour des
échantillons appariés, l'ANOVA par rangs de
Kruskal-Wallis, le test de la médiane, le test des signes,
l'ANOVA par rangs de Friedman, le test Q de
Cochran, le test de McNemar, le coefficient de concordance de Kendall,
le tau (b, c)
de Kendall, le R de Spearman, le test exact de
Fisher, les tests du Chi2,
le V2, Phi,
Gamma, le d de Sommer, les
coefficients de contingence, etc... (des statistiques et tests
non-paramétriques spécialisés sont
également disponibles dans d'autres modules, par exemple Analyse de Survie,
, etc..., ou dans le module Analyse
de Processus) Tous les tests (basés sur
des rangs) permettent de tenir compte des ex-aequos et appliquent des
corrections pour les petits n ou les ex-aequos.
Comme dans tous les autres modules de STATISTICA,
des graphiques sont intégrés à tous
les tests (notamment des nuages de points, boîtes
à moustaches spécialisées,
tracés curvilignes, histogrammes, et autres graphiques en 2D
ou 3D).
ANOVA/MANOVA.
Le module ANOVA/MANOVA ne contient qu'une partie des
fonctionnalités proposées dans le module Modèle
Linéaire Général
et peut réaliser des analyses de variance
univariées et multivariées sur des plans
factoriels avec ou sans mesures
répétées (ce module peut traiter au
maximum un facteur de mesure répétée).
Pour des modèles linéaires plus complexes avec
des variables prédictives catégorielles ou
continues, des effets aléatoires, et plusieurs facteurs de
mesures répétées, vous devez utiliser
le module Modèle Linéaire
Général (le module Modèles
Généraux de Régression (GRM)
offre diverses options d'analyse pas-à-pas et de
sélection du meilleur modèle). Dans le module
ANOVA/MANOVA , vous pouvez spécifier tous les
modèles de manière extrêmement simple,
en termes fonctionnels de variables et niveaux (et
non pas en termes techniques, par exemple, en spécifiant des
matrices de codes), et même les utilisateurs les moins
familiarisés avec l'ANOVA peuvent analyser des
modèles très complexes avec STATISTICA.
Interface-utilisateur. Comme dans le
module Modèle Linéaire
Général, le module ANOVA/MANOVA offre
trois interfaces-utilisateur alternatives pour spécifier les
modèles : (1) Un Assistant Analyse qui vous guide
pas-à-pas pour spécifier votre modèle,
(2) une interface-utilisateur simplifiée qui vous permet de
spécifier votre modèle en
sélectionnant les variables, les codes, les niveaux, et
d'autres options du modèle dans une boîte de
dialogue de spécifications rapides, et (3) un
Éditeur de Syntaxe qui vous permet de spécifier
vos modèles et leurs options grâce à
des mots-clé et une syntaxe commune.
Méthodes de calcul. Par
défaut, le programme utilise une paramétrisation
sigma-restreint pour les modèles factoriels et applique
l'approche de l'hypothèse efficace (voir Hocking, 19810)
lorsque le modèle n'est pas équilibré
ou s'il est incomplet. Il est possible de calculer les
hypothèses (standard) de type I, II, III, et IV ; les
hypothèses de type V et de type VI permettent de
réaliser des tests dans la logique des analyses-type des
plans factoriels fractionnaires utilisés dans les
applications industrielles et d'amélioration de la
qualité (voir aussi la description du module Plans
d'Expériences).
Résultats. Le module
ANOVA/MANOVA n'est pas limité en termes de routines de
calcul ce qui vous permet d'accéder à l'ensemble
des outils analytiques disponibles dans le module Modèle
Linéaire Général (voir la
description du module Module Linéaire
Général (GLM) pour plus d'informations)
; parmi les résultats standard, vous retrouverez les
tableaux de synthèse de l'ANOVA, les résultats
univariés et multivariés des facteurs de mesures
répétées à plus de 2
niveaux, les ajustements de Greenhouse-Geisser et Huynh-Feldt, les
tracés d'interactions, des statistiques descriptives
détaillées, diverses statistiques sur les
résidus, les comparaisons planifiées et tests post-hoc,
des tests d'hypothèses et termes d'erreur
personnalisés, diverses statistiques et tracés
diagnostiques détaillés (par exemple, un
histogramme des résidus intra, tests
d'homogénéité des variances,
tracés des moyennes en fonction des écarts-types,
etc...).
AJUSTEMENT
DE DISTRIBUTIONS. Les options du module Ajustement
de Distributions vous permettent de comparer la distribution
d'une variable en fonction de nombreuses distributions
théoriques. Vous pouvez ajuster vos données par
une distribution Normale, Uniforme,
Exponentielle, Gamma, Log-normale,
du Chi2, Weibull,
Gompertz, Binomiale, de Poisson,
Géométrique, ou de Bernoulli.
Vous pouvez ensuite évaluer l'ajustement par un test du Chi2
ou par un test de Kolmogorov-Smirnov (avec contrôle des
paramètres d'ajustement) ; les tests de Lilliefors et
Shapiro-Wilk sont également proposés (voir
ci-dessus). Vous pouvez évaluer l'ajustement d'une
distribution particulière à une distribution
empirique grâce à des histogrammes
personnalisés (standard ou cumulés) avec
superposition des fonctions sélectionnées ; vous
pouvez produire des graphiques curvilignes et en bâtons des
effectifs théoriques et observés, ou des
divergences et autres résultats dans toutes les feuilles de
données de résultats. D'autres options
d'ajustement de distributions sont proposées dans le module STATISTICA Analyse de
Processus, où l'utilisateur peut estimer
les paramètres par le maximum de vraisemblance pour les
distributions Bêta, Exponentielle,
Valeur Extrême (Type I, Gumbel), Gamma,
Log-normale, Rayleigh, et Weibull.
Ce module vous permet également de sélectionner
et ajuster automatiquement la meilleure distribution à vos
données, ou encore d'ajuster des distributions
générales par les moments (à l'aide
des courbes de Johnson et de Pearson). Des fonctions
personnalisées en 2 et 3 dimensions peuvent
également être représentées
et superposées sur les graphiques. Les fonctions peuvent
faire référence à de nombreuses
distributions comme la distribution Bêta,
Binomiale, de Cauchy, du Chi2,
Exponentielle, Valeur
Extrême, du F, Gamma,
Géométrique, Laplace,
Logistique, Normale, Log-normale,
de Pareto, de Poisson, Rayleigh,
du t (Student), ou de Weibull,
ou leurs intégrales et inverses. D'autres
fonctionnalités permettant d'ajuster des fonctions
prédéfinies ou personnalisées d'une
complexité quasi-illimitée à vos
données sont décrites dans le cadre du module Estimation
Non-Linéaire (disponible dans le produit
STATISTICA Statistiques Avancées).
Espace disque nécessaire : 220 Mo sans les Didacticiels / 500 Mo avec les Didacticiels en anglais
Versions natives en 64-bits et versions optimisées pour les ordinateurs multiprocesseurs disponibles.
Didacticiels en anglais
N'hésitez pas à consulter notre série de didacticiels en anglais sur YouTube ou sur notre site Web. Vous trouverez des vidéo-clips décrivant pas-à-pas différentes opérations que vous pouvez réaliser à l'aide de STATISTICA. Si vous souhaitez voir aborder un thème particulier, merci de nous écrire.
Avis des Utilisateurs...
De nombreuses sociétés utilisent STATISTICA en France et à travers le monde, dans
de nombreux domaines (industrie chimique/pétrochimique, semiconducteurs, industrie pharmaceutique, banques/assurances, ...)
et pour de nombreuses applications (R&D, contrôle qualité/Lean Six Sigma, analyse des données, marketing/CRM,
attrition, segmentation, scoring, modélisation prédictive, analyse sensorielle, ...).
Les raisons d'utiliser STATISTICA sont nombreuses, mais tous les utilisateurs soulignent souvent une grande
richesse fonctionnelle du logiciel, une qualité incomparable des graphiques, et une grande facilité de prise en main...
Ci-dessous, quelques témoignages d'utilisateurs
de STATISTICA :