Partager :

Concepts Fondamentaux en Statistique


Statistiques Élémentaires :

Calculateur de Probabilités



Sommaire :


Introduction

Le Calculateur de Probabilités vous permet de calculer les valeurs critiques d'une distribution, sur la base des paramètres ou degrés de liberté que vous avez spécifiés, ou des niveaux de significativité de la distribution. Ce calculateur dispose d'icônes graphiques interactives affichant les fonctions de densité et de répartition de la distribution spécifiée sur la base des paramètres correspondants. Vous pouvez afficher ces graphiques dans la fenêtre graphique standard (personnalisable) et les imprimer grâce à l'option Créer un Graphique. Ce calculateur est accessible par la commande Calculateur de Probabilités de la boîte de dialogue Statistiques Élémentaires (Panneau de Démarrage), accessible par le menu Statistiques.

Remarque : vous pouvez changer les paramètres en les modifiant manuellement dans le champ d'édition correspondant (vous devez cliquer sur le bouton Calculer pour effectuer les calculs), ou en utilisant les micro-défilements pour modifier les valeurs des champs d'édition. Lorsque vous utilisez les micro-défilements pour modifier une valeur, STATISTICA recalcule automatiquement les autres valeurs.

Distribution Bêta du Calculateur de Probabilités

Fonction de Densité. La distribution Bêta a la fonction de densité de probabilité suivante :

f(x) = G(n+w)/[G(n)G(w)] * [xn-1 * (1-x)w-1]

0 < x < 1, n > 0, w > 0

G

(Gamma) représente la fonction Gamma (d'argument alpha)

n, w

représentent les paramètres de forme

Fonction de Répartition. La fonction de répartition Bêta (le terme a été introduit pour la première fois par von Mises, 1919) est liée à la fonction incomplète Bêta. Pour plus d'informations, voir Pearson, 1968.

Bêta. Ce champ d'édition affiche la valeur de la variable aléatoire courante de la distribution Bêta. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyens des micro-défilements), STATISTICA calcule la valeur p associée à la distribution avec le degré de liberté spécifié.

p. Ce champ d'édition affiche la valeur de p calculée à partir de la variable aléatoire courante et des degrés de liberté ou vous pouvez entrer une valeur de p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique pour les degrés de liberté spécifiés.

Forme1, Forme2. Spécifiez, dans ces deux champs d'édition, les paramètres de forme de la distribution, n et w, respectivement. Si vous modifiez l'un de ces paramètres, la valeur de p sera alors recalculée sur la base de la ou des valeurs modifiées. 

Distribution de Cauchy du Calculateur de Probabilités

Fonction de Densité. La distribution de Cauchy a pour fonction de densité de probabilité :

f(x) = 1/( q*p*{1+[(x- h)/q]2})

0 < q

h

représente le paramètre de position (médiane)

q

représente le paramètre d'échelle

p

représente la constante Pi (3,14159...)

Fonction de Répartition. La fonction de répartition cumulée (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution de Cauchy est :

F(x) = 1/2 + 1/p*arctan[(x-h)/q]

C. Ce champ d'édition affiche la valeur de la variable aléatoire courante pour la distribution de Cauchy. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés.

p. Ce champ d'édition affiche la valeur p calculée à partir de la valeur et des paramètres spécifiés mais vous pouvez également saisir une valeur de p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique pour les paramètres spécifiés.

Position, Échelle. Spécifiez, dans ces deux champs d'édition, les paramètres de position et d'échelle de la distribution, respectivement, h et q. Si vous modifiez l'un de ces paramètres, la valeur p recalculée sera alors basée sur la valeur de la variable aléatoire correspondante. 

Distribution du Chi² du Calculateur de Probabilités

Fonction de Densité. La distribution du Chi² est définie par :

f(x) = {1/[2n/2 * G(n/2)]} * {x[(n/2)-1] * e(-x/2)}

n = 1, 2, ..., 0 < x

n

représente le nombre de degrés de liberté

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

G

(Gamma) est la fonction Gamma (d'argument alpha)

Chi². Ce champ d'édition affiche la valeur de la variable aléatoire courante pour la distribution du Chi². Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée au paramètre de forme spécifié.

p. Ce champ d'édition affiche la valeur p calculée à partir de la valeur de la variable aléatoire et du paramètre de forme (dl) spécifiés, mais vous pouvez également saisir une valeur de p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour le dl spécifié.

dl. Spécifier ici le paramètre de forme de la distribution, n. Si ce paramètre est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution Exponentielle du Calculateur de Probabilités

Fonction de Densité. La distribution Exponentielle a pour fonction de densité de probabilité :

f(x) = le(-lx)

0 £ x < ¥, l > 0

l

représente le paramètre d'échelle (un autre paramètre d'échelle possible est : l=1/b)

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution Exponentielle est :

F(x)

= 0, x£0

 

= 1-e(-lx), x>0

Exp. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution Exponentielle. Lorsque vous changez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et du paramètre d'échelle spécifiés, mais vous pouvez également saisir la valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour le paramètre spécifié.

Lambda. Spécifiez dans ce champ le paramètre d'échelle de la distribution, l. Si ce paramètre est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution Extrême du Calculateur de Probabilités

Fonction de Densité. La distribution Extrême (Type I) a pour fonction de densité de probabilité :

f(x) = 1/b * e[-(x-a)/b] * e**{-e[-(x-a)/b]}

-¥ < x < ¥, b > 0

a

représente le paramètre de position

b

représente le paramètre d'échelle

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution Extrême est :

F(x) = e**{-e[-(x-a)/b]}

V. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution Extrême. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des paramètres spécifiés, mais vous pouvez également saisir la valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Position, Échelle. Spécifiez, dans ces deux champs d'édition, les paramètres de seuil et d'échelle de la distribution, respectivement a et b. Si l'un de ces paramètres est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution F du Calculateur de Probabilités

Fonction de Densité. La distribution F (pour x > 0) a pour fonction de densité de probabilité (pour n = 1, 2, ... ; w = 1, 2, ...) :

f(x) = [G{(n+w)/2}]/[G(n/2)G(w/2)] * (n/w)(n/2) * x[(n/2)-1] * {1+[(n/w)*x]}[-(n+w)/2],   

n, w

représentent les paramètres de forme, les degrés de liberté

G

représente la fonction Gamma

F. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution F. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les degrés de liberté spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des degrés de liberté spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour les degrés de liberté spécifiés.

dl1, dl2. Spécifier, dans ces deux champs d'édition, les paramètres de forme de la distribution, respectivement n et w. Si l'un des paramètres est modifié, la valeur p recalculée sera basée sur la valeur de la variable aléatoire correspondante.

Distribution Gamma du Calculateur de Probabilités

Fonction de Densité. La distribution Gamma a pour fonction de densité de probabilité :

f(x) = [1/G(c)]*x(c-1) *e(-x)

0 £ x, c > 0

G

(Gamma) représente la fonction Gamma

c

représente le paramètre de forme

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

G. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution Gamma. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour le paramètre de forme spécifié.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et du paramètre de forme, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour le paramètre de forme spécifié.

Forme. Spécifiez dans ce champ le paramètre de forme de la distribution, c. Si ce paramètre est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution de Laplace du Calculateur de Probabilités

Fonction de Densité. La distribution de Laplace (ou Double Exponentielle) a pour fonction de densité de probabilité  :

f(x) = 1/(2b) * e[-(|x-a|/b)], -¥<x<¥

a

représente le paramètre de position (moyenne)

b

représente le paramètre d'échelle

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution de Laplace est :

F(x)

= 1/2 * e[-(a-x)/b], x < a

 

= 1 - {1/2 * e[-(x-a)/b]}, x ³ a

L. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution de Laplace. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des paramètres spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Position, Échelle. Spécifiez, dans ces deux champs d'édition, les paramètres de position et d'échelle de la distribution, respectivement a et b. Si vous modifiez l'un de ces paramètres, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution Logistique du Calculateur de Probabilités

Fonction de Densité. La distribution Logistique a pour fonction de densité de probabilité :

f(x) = (1/b) * e[-(x-a)/b] * {1+e[-(x-a)/b]}^-2,    pour -¥ < x < ¥, 0 < b

a

représente le paramètre de position (moyenne)

b

représente le paramètre d'échelle

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution Logistique est :

F(x) = {1 + e[-(x-a)/b]}^(-1)

Logistique. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution Logistique. Lorsque vous éditez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des paramètres spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Position, Échelle. Spécifiez, dans ces deux champs d'édition, les paramètres de position et d'échelle de la distribution, respectivement a et b. Si l'un de ces paramètres est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution Log-Normale du Calculateur de Probabilités

Fonction de Densité. La distribution Log-Normale a pour fonction de densité de probabilité :

f(x) = 1/[xs(2p)1/2] * e-[log(x)-m]^2/2s^2,    pour 0 < x < ¥, m > 0, s > 0

m

représente le paramètre d'échelle

s

représente le paramètre de forme

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

p

représente la constante Pi (3,14159...)

L. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution Log-Normale. Lorsque vous éditez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des paramètres spécifiés, mais vous pouvez également entrer une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Mu, Sigma. Spécifiez, dans ces deux champs d'édition, les paramètres de forme et d'échelle de la distribution, respectivement m et s. Si vous modifiez l'un de ces paramètres, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution de Pareto du Calculateur de Probabilités

Fonction de Densité. La distribution standard de Pareto a pour fonction de densité de probabilité :

a

représente le paramètre de forme

b

représente le paramètre d'échelle

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution de Pareto est :

F(x) = 1 - x(-c)

Pareto. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution de Pareto. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée po ur le paramètre de forme spécifié.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et du paramètre de forme spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Forme. Spécifiez, dans ce champ, le paramètre de forme de la distribution, c. Si ce paramètre est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution de Rayleigh du Calculateur de Probabilités

Fonction de Densité. La distribution de Rayleigh a pour fonction de densité de probabilité :

f(x) = x/b2 * e^[-(x2/2b2)],    pour 0 £ x < ¥, b > 0

b

représente le paramètre d'échelle

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution de Rayleigh est :

F(x) = 1 - e^[-(x2/2b2)]

R. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution de Rayleigh. Lorsque vous modifiez cette valeur (soit manuellement, soit au moyen des micro-défilements), STATISTICA calcule la valeur p associée pour le paramètre d'échelle spécifié.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et du paramètre d'échelle spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante au moyen des micro-défilements) et calculer la valeur critique de la distribution pour le paramètre spécifié.

Échelle. Spécifiez ici le paramètre d'échelle de la distribution, b. Si ce paramètre est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante. 

Distribution du t (de Student) du Calculateur de Probabilités

Fonction de Densité. La distribution du t de Student a pour fonction de densité de probabilité (pour n = 1, 2, . . .) :

f(x) = G[(n+1)/2] / G(n/2) * (n*p)-1/2 * [1 + (x2/n)-(n+1)/2

n

représente le paramètre de forme, degrés de liberté

G

(Gamma) représente la fonction Gamma

p

représente la constante Pi (3,14159...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution du t de Student dépend de la parité de n (pair ou impair). Vous trouverez une explication détaillée dans l'ouvrage de Evans, Hastings et Peacock, 1993.

t. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution du t de Student. Lorsque vous modifiez cette valeur (soit manuellement, soit en utilisant les micro-défilements), STATISTICA calcule la valeur p associée pour les degrés de liberté spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des degrés de liberté spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante en utilisant les micro-défilements) et calculer la valeur critique de la distribution pour les degrés de liberté spécifiés.

dl. Spécifiez, dans ce champ, le paramètre de forme de la distribution, n. Si ce paramètre est modifié, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution de Weibull du Calculateur de Probabilités

Fonction de Densité. La distribution Weibull a pour fonction de densité de probabilité :

f(x) = c/b*(x/b)(c-1) * e[-(x/b)^c],    pour 0 £ x < ¥, b > 0, c > 0

b

représente le paramètre d'échelle

c

représente le paramètre de forme

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

Fonction de Répartition. La fonction de répartition (le terme a été introduit pour la première fois par Wilk en 1943) de la distribution de Weibull est :

F(x) = 1 - e[-(x/b)^c]

Pondération. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution de Weibull. Lorsque vous modifiez cette valeur (soit manuellement, soit en utilisant les micro-défilements), STATISTICA calcule la valeur p associée pour les paramètres spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des paramètres spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante en utilisant les micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Forme, Échelle. Spécifiez, dans ces deux champs d'édition, les paramètres de forme et d'échelle de la distribution, respectivement b et c. Si vous modifiez l'un de ces paramètres, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Distribution Z (Normale) du Calculateur de Probabilités

Fonction de Densité. La fonction de distribution Normale est déterminée par la formule suivante :

f(x) = 1/[s(2p)1/2] * e{-1/2*[(x-m)/s]^2}

-¥ < x < ¥

m

représente la moyenne

s

représente l'écart-type

e

représente la base du logarithme népérien, parfois appelée e d'Euler (2,71...)

p

représente la constante Pi (3,14159...)

Z. Ce champ affiche la valeur de la variable aléatoire courante pour la distribution Z (Normale). Lorsque vous modifiez cette valeur (soit manuellement, soit en utilisant les micro-défilements), STATISTICA calcule la valeur p associée en fonction des paramètres spécifiés.

p. Ce champ affiche la valeur p calculée à partir de la valeur de la variable aléatoire et des paramètres spécifiés, mais vous pouvez également saisir une valeur p désirée (soit manuellement, soit en modifiant la valeur existante, en utilisant les micro-défilements) et calculer la valeur critique de la distribution pour les paramètres spécifiés.

Moyenne, écart-type. Spécifiez, dans ces deux champs d'édition, les paramètres de position et d'échelle de la distribution, respectivement la moyenne et l'écart-type. Si vous modifiez l'un de ces paramètres, la valeur p sera alors recalculée sur la base de la valeur de la variable aléatoire correspondante.

Ajustement de Distributions

Le module Ajustement de Distributions est utilisé pour évaluer l'ajustement des données observées à des distributions théoriques. Reportez-vous à la rubrique Types de Distributions pour obtenir une description des distributions disponibles. Notez également que le module Analyse de Survie comporte des procédures spécialisées pour ajuster des données censurées (incomplètes) pour l'analyse de survie ou du temps à l'échec par les distributions de Weibull et de Gompertz. Le fichier de données utilisé pour cet exemple est Irisdat.sta (une partie de ce fichier de données est visible ci-dessous). Ouvrez ce fichier de données à l'aide de la commande Ouvrir des Exemples du menu Fichier ; vous trouverez ce fichier dans le répertoire Fichiers de Données. Ce fichier comporte des données rapportées par Fisher (1936) sur les longueurs et largeurs des sépales (Lonsepal, Larsepal) et des pétales (Lonpetal, Larpetal) pour 50 fleurs de trois types d'iris différents. Une analyse discriminante de ce fichier de données est également réalisée dans la rubrique Analyse Discriminante - Exemple.

Les distributions des quatre variables décrivant les longueurs et largeurs des sépales et pétales vont à présent être examinées. Plus particulièrement, on s'attend à ce que ces mesures suivent la distribution normale.

Spécification de l'analyse. Sélectionnez la commande Ajustement de Distributions à partir du menu Statistiques pour afficher le Panneau de Démarrage Ajustement de Distributions. Puis, sélectionnez le bouton d'option Distributions Continues et effectuez un double-clic sur l'option Normale dans la liste de choix. Dans la boîte de dialogue résultante (Ajustement de Distributions Continues), cliquez sur le bouton Variable pour afficher la boîte de dialogue standard de sélection de variables. Là, sélectionnez la variable Lonsepal puis cliquez sur le bouton OK. A ce point, le fichier de données va être traité et l'onglet Paramètres va afficher la moyenne et la variance calculées comme valeurs par défaut pour les champs Moyenne et Variance. Vous pouvez également ajuster le Nombre de catégories et les Limites inférieure et supérieure pour les calculs de distributions de fréquence. La boîte de dialogue Ajustement de Distributions Continues - onglet Paramètres apparaît ainsi :

Maintenant, cliquez sur l'onglet Options et sélectionnez le bouton d'option Oui (continu) dans le cadre Test de Kolmogorov-Smirnov. Acceptez toutes les autres sélections par défaut de cette boîte de dialogue et cliquez sur le bouton Synthèse pour calculer la distribution de fréquence.

Tests statistiques. La valeur du Chi-deux est significative au niveau de 0,05 (p = 0,025). En conséquence, sur la base du test du Chi-deux, vous pouvez conclure que la distribution dévie significativement de la distribution normale standard. Cependant, le test du d de Kolmogorov-Smirnov n'est pas significatif (p < 0,20). Ce type de résultat n'est pas rare parce que le test de Kolmogorov-Smirnov n'est pas une procédure aussi précise qu'une technique de détection de grosses déviations par rapport à une distribution supposée. Fréquemment, la valeur du Chi-deux est une valeur grandement affectée par la façon par laquelle la distribution est "découpée", c'est-à-dire, par le nombre de catégories, les valeurs minimum, et maximum que vous avez choisi. Par exemple, si vous découpez la distribution de Lonsepal en 23 parties (saisissez 23 dans le champ d'édition Nombre de catégories de l'onglet Paramètres), à la place de la valeur par défaut de 10 catégories, alors la valeur du Chi-deux résultante est seulement significative marginalement au niveau p = 0,05.

Ce qui est important est la façon dont la forme générale de la distribution observée approche la distribution normale théorique.

À présent, revenez à la boîte de dialogue Ajustement de Distributions Continues. Dans l'onglet Options, du cadre Graphique, vous pouvez choisir de tracer un histogramme de la Distribution de fréquence ou de la Distribution cumulée avec les Effectifs bruts ou les Fréquences relatives.

Acceptez les sélections par défaut pour le graphique et cliquez sur le bouton Tracé de la distribution observée et théorique de l'onglet Base pour produire l'histogramme de fréquence de cette variable. (Notez que vous devez toujours avoir 23 dans le champ d'édition Nombre de catégories de l'onglet Paramètres.)

Il semble que la distribution de Lonsepal soit bimodale, c'est-à-dire qu'il semble y avoir deux "pics". De plus, il y a un manque d'ajustement important du côté gauche de la distribution observée où le premier pic apparaît. En conséquence vous pouvez conclure à partir de cette analyse que la distribution normale continue ne constitue probablement pas un modèle adéquat de la distribution observée.

Voir aussi la rubrique Ajustement de Distribution.

Didacticiels

Vous pouvez visionner l'intégralité de la série de tutoriels Le Data Mining en 35 Leçons avec STATISTICA en remplissant le formulaire d'inscription. Vous serez alors notifié(e) automatiquement de la disponibilité des nouveaux épisodes et recevrez d'autres informations utiles.

StatSoft propose par ailleurs une série de didacticiels et présentations interactives décrivant pas-à-pas différentes opérations que vous pouvez réaliser à l'aide de STATISTICA. Si vous souhaitez voir aborder un thème particulier, merci de nous écrire.