Concepts Fondamentaux en Statistique

Plans d'Expériences :

Plans Composites Centrés, Non-Factoriels et de Surfaces



Sommaire :


Introduction

Les plans 2(k-p) et 3(k-p) nécessitent que tous les niveaux des facteurs soient fixés, par exemple, à 2 ou à 3 niveaux. Dans de nombreux cas, ces plans sont irréalisables, parce que telle ou telle combinaison de facteurs peut être contrainte d'une certaine manière (par exemple, les facteurs A et B ne peuvent pas être fixés à leur niveau supérieur simultanément). En outre, pour des raisons d'efficacité que nous aborderons brièvement, il est souvent souhaitable d'explorer la région expérimentale pour des points particuliers ne pouvant pas être représentés par un plan factoriel.

Les plans (et la manière de les analyser) présentés dans cette section concernent tous l'estimation (l'ajustement) de surfaces de réponse, dont l'équation générale du modèle est de la forme suivante :

y = b0 +b1 *x1 +...+bk *xk + b12 *x1 *x2 +b13 *x1 *x3 +...+bk-1,k *xk-1 *xk + b11 *x1² +...+bkk *xk²

Plus explicitement, nous ajustons un modèle aux valeurs observées de la variable dépendante y, qui comprend (1) les effets principaux des facteurs x1 , ..., xk, (2) leurs interactions (x1*x2, x1*x3, ... ,xk-1*xk) et (3) leurs composantes quadratiques (x12, ..., xk2). Il n'existe aucune hypothèse concernant les "niveaux" des facteurs et vous pouvez analyser tout ensemble de valeurs continues des facteurs.

Certaines considérations sur l'efficacité et les biais des plans ont permis d'élaborer des plans standard habituellement utilisés lors de l'ajustement de surfaces de réponse ; nous aborderons rapidement ces plans standard (par exemple, voir Box, Hunter, et Hunter, 1978 ; Box et Draper, 1987  ; Khuri et Cornell, 1987 ; Mason, Gunst, et Hess, 1989 ; Montgomery, 1991). Mais, comme nous le verrons plus tard dans le cadre des plans de surface sous contraintes et des plans D et A optimaux, ces plans standard s'avèrent parfois inutilisable pour des raisons pratiques. Toutefois, l'analyse d'un plan composite centré ne fait aucune hypothèse quant à la structure de votre fichier de données, c'est-à-dire, le nombre de valeurs distinctes par facteur, ou leurs combinaisons dans les essais de l'expérience, et vous pouvez donc utiliser ces options pour analyser tout type de plan, afin d'ajuster les données au modèle général décrit ci-dessus.

Considérations du Plan

Plans orthogonaux. Nous cherchons toujours, quel que soit le plan, à obtenir des effets principaux et interactions qui soient indépendants entre eux. Par exemple, supposons que nous ayons réalisé une expérience à deux facteurs, chacun possédant deux niveaux. Notre plan est constitué de quatre essais :

 

A

B

Obs. 1

Obs. 2

Obs. 3

Obs. 4

1

1

-1

-1

1

1

-1

-1

Pour les deux premières observations, les facteurs A et B sont à leur niveau supérieur (+1). Pour les deux dernières observations, ces deux facteurs sont à leur niveau inférieur (-1). Imaginons que vous souhaitiez estimer la contribution individuelle (indépendante) des facteurs A et B à la prévision de la variable dépendante étudiée. Ce plan n'a aucun sens parce qu'il n'est pas possible d'estimer l'effet principal de A et l'effet principal de B. On ne peut estimer qu'un effet -- la différence entre les Obs 1+2 vs. Obs 3+4 -- qui représentent l'effet combiné de A et B.

Le problème ici est que, pour définir les contributions indépendantes des deux facteurs, les niveaux des facteurs pour les quatre essais doivent être tels que les "colonnes" du plan (A et B dans notre exemple) soient indépendantes. En d'autres termes, les colonnes de la matrice du plan (avec autant de colonnes que de paramètres d'effets principaux et d'interactions à estimer) doivent être orthogonales (ce terme a été utilisé pour la première fois par Yates, 1933). Par exemple, si les quatre essais du plan sont organisés comme suit,

 

A

B

Obs. 1

Obs. 2

Obs. 3

Obs. 4

1

1

-1

-1

1

-1

1

-1

les colonnes A et B sont bien orthogonales. Il est donc désormais possible d'estimer l'effet principal de A en comparant le niveau supérieur de A pour chaque niveau de B, au niveau inférieur de A pour chaque niveau de B ; l'effet principal B peut être estimé de la même manière.

Techniquement, deux colonnes d'une matrice de plan sont orthogonales si la somme du produit des éléments de chaque ligne est égale à zéro. En pratique, on est souvent confronté à des situations où, par exemple, en raison de la perte de certaines données dans certains essais ou d'autres contraintes, les colonnes de la matrice du plan ne sont pas complètement orthogonales. D'une manière générale, la règle qui s'applique est la suivante  : plus les colonnes seront orthogonales, meilleur sera le plan, c'est-à-dire, d'autant plus d'informations indépendantes pourront être extraites du plan pour les effets étudiés. Par conséquent, une considération devant entrer dans le choix des plans standard composites centrés est de trouver des plans orthogonaux ou presque orthogonaux.

Plans isovariants par rotation. La seconde considération est liée à la première condition, en ce sens qu'on recherche comment extraire au mieux le maximum d'information (non biaisée) du plan, ou, plus précisément, de la région expérimentale étudiée. Sans entrer dans le détail (voir Box, Hunter et Hunter, 1978 ; Box et Draper, 1987, Chapitre 14 ; voir aussi Deming et Morgan, 1993, Chapitre 13), on peut montrer que l'erreur-type de la prévision des valeurs de la variable dépendante est proportionnelle à :

(1 + f(x)' * (X'X)-1 * f(x))1/2

f(x) représente les effets du facteur (codé) du modèle respectif (f(x) est un vecteur dont f(x)' est la transposée), et X est la matrice du plan d'expérience, c'est-à-dire la matrice des effets du facteur codé pour toutes les observations ; X'X-1 est l'inverse de la matrice de produit croisé. Deming et Morgan (1993) appellent cette expression, l'incertitude normalisée ; cette fonction est également liée à la fonction de variance définie par Box et Draper (1987). La quantité d'incertitude dans la prévision des valeurs de la variable dépendante est fonction de la dispersion des points du plan, et de leur covariance sur les essais (notez que c'est inversement proportionnel au déterminant de X'X  ; cette question sera abordée dans la rubrique sur les plans D et A optimaux).

Le problème ici est qu'à nouveau, nous voudrions choisir un plan qui extrait le plus d'informations possible concernant la variable dépendante, et qui laisse le moins d'incertitude quant aux prévisions des valeurs futures. Il s'avère que la quantité d'informations (ou information normalisée selon Deming et Morgan, 1993) est l'inverse de l'incertitude normalisée.

Pour l'expérience orthogonale simple de 4 essais donnée précédemment, la fonction d'information est égale à :

Ix = 4/(1 + x12 + x22)

x1 et d x2 représentent respectivement les paramétrages des facteurs A et B (voir Box et Draper, 1987). L'étude de cette fonction dans un tracé indique des cercles constants et concentriques autour de l'origine. Par conséquent tout type de rotation des points du plan original générera la même quantité d'information, c'est-à-dire la même fonction d'information. Par conséquent, le plan orthogonal 2 x 2 avec 4 essais donné plus tôt est dit isovariant par rotation.

Comme nous l'avons déjà souligné, pour estimer la composante quadratique ou non-linéaire du second ordre de la relation entre un facteur et la variable dépendante, il nous faut au moins 3 niveaux pour les facteurs respectifs. A quoi ressemble la fonction d'information d'un plan factoriel simple 3 x 3, dans un modèle quadratique du second ordre comme celui présenté en début de section ? Il s'avère que (voir Box et Draper, 1987 et Montgomery, 1991 ; veuillez également vous reporter au manuel) cette fonction semble plus complexe, et qu'elle contient des "poches" à haute densité d'information à la marge (qui sont vraisemblablement d'un intérêt limité pour l'expérimentateur) ; clairement elle n'est pas en cercles concentriques constants autour de l'origine. Par conséquent, elle n'est pas isovariante par rotation, ce qui veut dire que différentes rotations des points du plan vont permettre d'extraire différentes quantités d'information de la région expérimentale.

Points en étoile et plans isovariants par rotation du second ordre. On peut montrer qu'en ajoutant des points en étoile aux points du plan factoriel simple à 2 niveaux (carré ou cubique), on peut obtenir des plans isovariants par rotation, souvent orthogonaux ou presque orthogonaux. Par exemple, en ajoutant au plan orthogonal simple 2 x 2 donné plus tôt les points suivants, nous produisons un plan isovariant par rotation :

 

A

B

Obs. 1

Obs. 2

Obs. 3

Obs. 4

Obs. 5

Obs. 6

Obs. 7

Obs. 8

Obs. 9

Obs. 10

 1

 1

-1

-1

-1.414

 1.414

 0

 0

 0

 0

 1

-1

 1

-1

 0

 0

-1.414

 1.414

 0

 0

Les quatre premières observations du plan sont les points du plan factoriel 2 x 2 précédent (ou points carrés ou points cube) ; les observations 5 à 8 sont appelées points étoile ou points axiaux, et enfin les observations 9 et 10 sont les points centraux. La fonction d'information de ce plan pour le modèle du second ordre (quadratique) est isovariante par rotation, c'est-à-dire qu'elle est forme des cercles constants autour de l'origine (veuillez vous reporter également au manuel pour d'autres illustrations).

Alpha pour l’Isovariance par Rotation et l'Orthogonalité

Les deux caractéristiques de plan évoquées jusqu'ici -- orthogonalité et isovariance par rotation -- dépendent du nombre de points centraux dans le plan ainsi que la distance axiale a (Alpha), qui représente la distance des points en étoile au centre du plan (c'est-à-dire 1,414 dans le plan donné ci-dessus). On peut montrer (par exemple, voir Box, Hunter, et Hunter, 1978 ; Box et Draper, 1987, Khuri et Cornell, 1987 ; Montgomery, 1991) qu'un plan est isovariant par rotation si :

a = ( nc )1/4

nc représente le nombre de points cube dans le plan (c'est-à-dire les points de la partie factorielle du plan).

Un plan composite centré sera orthogonal si nous choisissons la distance axiale telle que :

a = {[( nc + ns + n0 )1/2 - nc1/2]2 * nc/4}1/4

nc

représente le nombre de points cube du plan

ns

représente le nombre de points en étoile du plan

n0

représente le nombre de points centraux du plan

Pour rendre un plan à la fois (approximativement) orthogonal et isovariant par rotation, il faut tout d'abord choisir la distance axiale pour l’isovariance par rotation, puis ajouter les points centraux (voir Kkuri et Cornell, 1987), de sorte que :

n0 » 4*nc1/2 + 4 - 2k

k représente le nombre de facteurs du plan.

Enfin, si vous utilisez des blocs, Box et Draper (1987) donnent la formule suivante pour calculer la distance axiale afin d'obtenir des blocs orthogonaux, et dans la plupart des cas, des contours raisonnables pour la fonction d'information, c'est-à-dire des contours presque sphériques :

a = [k*(1+ns0/ns)/(1+nc0/nc)]1/2

ns0

représente le nombre de points centraux dans la partie étoile du plan

ns

représente le nombre de points en étoile non centraux du plan

nc0

représente le nombre de points centraux dans la partie cubique du plan

nc

représente le nombre de points cube non centraux du plan

Le module Plans d'Expériences vous permet de choisir un plan dans un catalogue de plans standard (avec et sans blocs), et de choisir la valeur a, soit pour l'orthogonalité, l’isovariance par rotation, ou les deux.

Plans Standard Disponibles

Les plans standard composites centrés sont souvent construits à partir d'un plan 2(k-p) pour la partie cubique du plan, qui est enrichie de points centraux et de points en étoile. Box et Draper (1987) ont dressé la liste de certains de ces plans.

Petits plans composites. Dans les plans standard, la portion cubique du plan est typiquement de résolution V (ou supérieure). Ce n'est cependant par nécessaire, et dans les cas où les essais expérimentaux sont coûteux, ou lorsqu'il n'est pas nécessaire de réaliser un test statistiquement puissant de l'adéquation du modèle, il est possible de choisir pour la partie cubique, un plan de résolution III, par exemple, construit à partir de plans Plackett-Burman hautement fractionnés. Hartley (1959) a décrit ces plans, également disponibles dans le module Plans d'Expériences.

Analyser un Plan Composite Centré

L'analyse des plans composites centrés se fait de manière similaire aux plans 3(k-p). Le programme va ajuster aux données le modèle général décrit ci-dessus ; par exemple, pour deux variables, le programme ajusterait le modèle :

y = b0 + b1*x1 + b2*x2 + b12*x1*x2 + b11*x12 + b22*x22

Naturellement, le module Plans d'Expériences vous permet d'inclure ou d'exclure de façon flexible les différents termes du modèle. 

La Surface de Réponse Ajustée

La forme de la réponse globale ajustée peut être mieux représentée dans les graphiques. Le module Plans d'Expériences permet de produire des courbes d'isoréponse et des surfaces de réponse du modèle ajusté.

Surfaces de Réponse Catégorisées

Notez que les options des Graphiques XYZ en 3D offrent des outils très puissants pour l'analyse des surfaces de réponse. En fait, certaines de ces options permettent de réaliser des analyses qui ne sont souvent pas présentées dans les ouvrages standard sur le sujet. Plus précisément, vous pouvez ajuster des surfaces en 3D à vos données, catégorisées par une autre variable. Par exemple, si vous répliquez un plan composite centré standard 4 fois, il peut être intéressant et informatif de voir si les surfaces sont similaires après ajustement de chaque réplication. Vous pouvez ainsi obtenir des indications graphiques quant à la fiabilité des résultats et pour localiser les écarts (par exemple, dans quelle région de la surface).

Valeurs Critiques des Plans Composites Centrés

L'onglet Base et l'onglet Prévision & profil de la boîte de dialogue Analyse d'un Plan Composite Centré (Surface de Réponse) contiennent le bouton Valeurs critiques (min, max, "selle"), disponible pour toute surface de réponse quadratique utilisée pour prévoir la variable dépendante. Cliquez sur le bouton Valeurs critiques (min, max, "selle") pour afficher trois feuilles de données donnant les résultats de l'analyse de la surface de réponse quadratique  :

Surface de réponse. La feuille de données Surface de réponse affiche les effets de second-ordre des variables de prévision sur la réponse (c'est-à-dire, les interactions linéaire par linéaire et les effets quadratiques), et les effets de premier ordre des variables de prévision sur la réponse (c'est-à-dire, les effets principaux). Notez que ces effets correspondent à ceux de la feuille de données affichés quand vous cliquez sur le bouton Coefficients de Régression à l'onglet ANOVA/Effets.

Valeurs propres et Vecteurs propres. La feuille de données Valeurs propres et Vecteurs propres sert à identifier la forme et l'orientation de la surface de réponse quadratique. Le déterminant de la matrice des effets de second ordre des variables de prévision sur la réponse est affiché dans la boîte d'information dans la partie supérieure de la feuille de données. Si le déterminant est proche de zéro, la surface de réponse est presque plate dans au moins une direction. Les valeurs propres des effets de second ordre représentent la courbure de surface de réponse quadratique. Les valeurs propres sont positives si les courbes de surface de réponse ont un mouvement ascensionnel à partir d'un minimum, et sont négatives si les courbes de surface se dirigent vers le bas à partir d'un maximum. Les valeurs propres mélangées indiquent que la surface est façonnée comme une "selle", s'incurvant vers le haut dans une direction et vers le bas dans une autre. Les vecteurs propres montrent les orientations des axes principaux de surface de réponse quadratique relative aux axes des variables de prévision originales. Une valeur élevée de la variable de prévision sur l'axe principal indique que l'axe de surface de réponse est orienté dans la même direction que l'axe de la variable de prévision. L'étude des vecteurs propres et leurs valeurs propres correspondantes fournit une information utile sur la courbure (croissante ou décroissante), ou manque de cela (aplatissement) de la surface de réponse quadratique dans chaque direction définie par les axes des variables de prévision originales.

Valeurs Critiques. La feuille de données des Valeurs Critiques affiche l'information identifiant le point de surface de réponse quadratique minimum, maximum, ou point de "selle" (saddlepoint) de la surface. Les valeurs critiques pour les variables de prévision sont les coordonnées (sur les axes des variables de prévision) de l'origine de surface de réponse quadratique. La boîte d'information dans la partie supérieure de la feuille de résultats affiche si ce point représente un minimum, un maximum, ou un "saddlepoint" sur la surface de réponse. La valeur prévue de la variable dépendante pour les valeurs critiques pour chacune des variables de prévision est aussi affichée dans la boîte d'information. Les trois colonnes de la feuille de données des Valeurs Critiques donne une liste des valeurs Observées minimum des variables de prévision, les Valeurs Critiques des variables de prévision, et les valeurs Observées maximum des variables de prévision. Les lignes de la feuille de données des Valeurs Critiques dans lesquelles la valeur critique sort de l'étendue observée de la variable de prévision est mis en surbrillance. Cela porte l'attention sur une origine de surface de réponse qui sort du champ expérimental, et sur la variable de prévision (ou variables) pour laquelle l'origine se trouve au delà de l'étendue observée.

Voir aussi la rubrique Effets Principaux et Interactions.

Effets Principaux et Interactions des Plans Composites Centrés

L'onglet Base et l'onglet ANOVA/Effets de la boîte de dialogue Analyse d'un Plan Composite Centré (Surface de Réponse) contiennent le bouton Synthèse  : Effets estimés. Cliquez sur ce bouton pour afficher une feuille de données avec les effets estimés de l'ANOVA et coefficients du modèle pour les valeurs des facteurs regraduées. Si un terme d'erreur pour l'ANOVA est disponible, cette feuille de données comprendra également les erreurs types des paramètres estimés et coefficients, leurs intervalles de confiance, et leur significativité statistique.

Toutes les estimations dans cette feuille de données se réfèrent aux paramétrages de facteurs codés. Pour voir les résultats des paramétrages de facteurs originaux (non transformés), utilisez le bouton Coefficients de régression dans l'onglet ANOVA/Effets.

Moyenne/Ordonnée à l'origine. La ligne appelée Moyenne/Ordonnée à l'Origine contient l'estimation de l'ordonnée à l'origine pour le modèle de régression, basée sur les paramétrages de facteurs codés (voir aussi le module Régression Multiple).

Effets de bloc. Les effets de bloc sont calculés à partir des variables ajoutées recodifiées (au plan), une pour chaque degré de liberté. Par exemple, si vous avez 4 blocs dans le plan, 3 nouvelles variables seront créées pour exploiter les 3 degrés de liberté associés à l'effet de bloc global. Plus précisément, chaque nouvelle variable bi se calcule ainsi :

bi = -1

si bloc = 1

1

si bloc = i+1

0

sinon

Effets principaux linéaires. Les valeurs données dans la colonne appelée Effet, et dans les lignes étiquetées par les effets principaux, sont les effets estimés de l'ANOVA. Elles peuvent s'interpréter comme les différences (pour la variable dépendante) entre les paramétrages inférieurs et les paramétrages supérieurs pour les facteurs respectifs (voir aussi le bouton noms de facteurs et paramétrages de l'onglet Plan). Les valeurs données dans la colonne appelée Coeff. sont les coefficients de régression du modèle codé, et peuvent s'interpréter comme les différences entre les paramétrages supérieurs des facteurs et les moyennes des paramétrages inférieurs et supérieurs des facteurs pour les facteurs respectifs. Ils ont la moitié de la taille des estimations de l'Effet.

Effets principaux quadratiques. Les valeurs données dans la colonne appelée Effet, et dans les lignes contenant des noms de facteurs suivis d'un (Q), sont des estimations des effets principaux quadratiques. Les valeurs données dans la colonne appelée Coeff. sont les coefficients de régression respectifs, qui sont la moitié de la taille des Effets.

Interaction linéaire par linéaire. Les valeurs de la colonne Effet, dans les lignes dénotant les effets d'interaction linéaires de facteur, sont calculées comme la moitié des coefficients (donnés dans la colonne Coeff.) des interactions. Les coefficients sont des coefficients de régression pour le produit des valeurs de facteurs regradués.

Erreur-type de l'estimation des paramètres. Les erreurs-types de l'estimation des paramètres (estimations et coefficients ANOVA) sont calculées à partir du terme d'erreur ANOVA courant, tel qu'il a été sélectionné dans la boîte Terme d'erreur de l'ANOVA, et selon le modèle qui a été spécifié dans le cadre Inclure dans le modèle de l'onglet Modèle.