Méthode Ziggourat

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La méthode Ziggourat est un algorithme pour engendrer des nombres aléatoires de loi non uniforme. Il s'agit d'une méthode de rejet et peut être choisie pour simuler une variable aléatoire ayant une densité strictement monotone. Cette méthode peut aussi être appliquée à des lois symétriques unimodales telles que la loi normale en choisissant un point sur l'une des moitiés et en choisissant le côté aléatoirement. Cette méthode a été développée par George Marsaglia et Wai Wan Tang.

Comme la plupart des algorithmes de ce type, il suppose que l'on dispose d'un générateur de nombres aléatoires de loi uniforme, en général un générateur pseudo-aléatoire. Dans la plupart des cas, comme la loi normale ou la loi exponentielle, l'algorithme consiste à engendrer un nombre flottant, un index aléatoire de table, faire une recherche dans une table, une multiplication et une comparaison. Cet algorithme est considérablement plus rapide que les autres méthodes pour simuler des variables aléatoires de loi normale, comme la méthode de Box-Muller qui requièrent de calculer une racine carrée ou un logarithme. D'un autre côté, cette méthode est plus complexe à implémenter et nécessite des tables précalculées, de sorte qu'il vaut mieux l'utiliser lorsque l'on a besoin de nombres aléatoires en grande quantité.

Le nom de cette méthode provient du fait qu'elle couvre la densité de la loi avec des segments rectangulaires empilés par ordre de taille décroissant, ce qui ressemble donc à une ziggourat.

Théorie[modifier | modifier le code]

La méthode Ziggourat est une méthode de rejet. La position d'un point est engendrée aléatoirement à l'intérieur d'une courbe délimitant une surface légèrement plus grande que celle délimitée par la densité de la loi considérée. On teste alors si ce point se trouve dans cette dernière surface. Si c'est le cas, on retourne l'abscisse du point. Sinon, on rejette ce point et on en tire un nouveau.

Pour construire la surface qui recouvre la densité, on choisit une surface composée de régions de tailles égales, dont sont des rectangles empilés au-dessus d'une région non rectangulaire qui couvre la queue de la densité de la loi.

Si est la densité de la loi à simuler, la base de la ziggourat se compose donc d'un rectangle allant dont le coin inférieur gauche a pour coordonnées et le coin supérieur à pour coordonnées , et de l'ensemble des points situés sous la courbe pour . Cette couche délimite une région d'aire . On place au-dessus une région rectangulaire dont le coin inférieur gauche est et le coin supérieur droit , où est pour que l'aire de ce rectangle soit égale à . On construit de même un rectangle de coordonnées définies par et d'aire On construit ainsi une suite de points pour un nombre de couches donné à l'avance (typiquement, ). Les coordonnées des points dépendent de .

En ignorant pour l'instant le problème de la première couche qui n'est pas rectangulaire, l'algorithme est le suivant :

  1. On choisit aléatoirement de façon une couche avec une probabilité .
  2. Si , on utilise alors un algorithme spécifique (voir plus bas)
  3. On se donne une réalisation d'une variable aléatoire uniforme sur
  4. On pose
  5. Si , alors on retourne
  6. Sinon on se donne une réalisation d'une variable aléatoire uniforme sur
  7. On calcule avec
  8. Si , on retourne
  9. Sinon, on recommence l'algorithme depuis le début.

Pour une loi dont la densité est symétrique, il suffit juste de tester si en utilisant pour une variable aléatoire uniforme sur .

Algorithmes pour la queue de la densité[modifier | modifier le code]

Lorsque la densité à un support non compact (comme c'est la cas pour la loi normale, la loi exponentielle...), il est alors nécessaire d'utiliser un algorithme spécifique lorsque la première tranche est sélectionnée. Cet algorithme dépend de la loi.

La première couche peut se diviser en une région centrale rectangulaire, et une région avec une queue infinie. On peut utiliser le même algorithme en ajoutant un point fictif et en tirant un point une réalisation d'une variable aléatoire uniforme sur . Si , on retourne . Sinon, on a besoin de tirer une réalisation de cette variable aléatoire sachant qu'elle est plus grande que la valeur . Pour la loi exponentielle de paramètre , cela se fait très facilement par est la réalisation d'une variable aléatoire uniforme sur .

Une autre possibilité consiste à appeler l'algorithme Ziggourat de façon récursive sur la queue de la densité.

Pour la loi normale, G. Marsaglia[1] propose la méthode suivante :

  1. On calcule est la réalisation d'une variable aléatoire uniforme sur .
  2. On calcule est la réalisation d'une variable aléatoire uniforme sur .
  3. Si alors on retourne ,
  4. Sinon, on revient au premier pas.

Comme pour une taille de table typique (n=128), , le test du pas no 3 est presque toujours vérifié. Puisque renvoie une réalisation d'une variable aléatoire exponentielle, si l'on dispose d'une méthode Ziggourat pour l'exponentielle, on peut l'utiliser à cette fin.

Optimisations[modifier | modifier le code]

L'algorithme peut tourner de façon efficace en utilisant des tables précalculées pour les et les , mais il existe des astuces pour le rendre encore plus rapide. La principale idée est que rien ne requiert que l'on utilise pour une fonction d'aire . On peut donc utiliser cet algorithme sur des densités non normalisées, ce qui accélère le calcul de (par exemple, pour la loi normale, on peut utiliser au lieu de ).

Comment engendrer les tables ?[modifier | modifier le code]

Il est possible de stocker dans l'algorithme la table entière des points et , ou bien juste les valeurs , et et de calculer les autres valeurs juste durant la phase d'initialisation des calculs.

Comment trouver et  ?[modifier | modifier le code]

Étant donné un nombre de niveau , on a besoin de trouver la valeur de et de telles que et . Pour la loi exponentielle de paramète , on a l'aire . La fonction de répartition de la loi normale est très souvent implémentée dans de nombreuses bibliothèques numériques. Pour d'autres lois, il peut être nécessaire d'utiliser des procédures d'intégration numérique. L'idée est alors d'utiliser un algorithme de recherche de zéro en partant d'une estimation initiale de afin de résoudre

en calculant les successivement jusqu'à de sorte que l'aire de chaque tranche soit égale à pour une estimation donnée de .

Notes et références[modifier | modifier le code]

  1. (en) George Marsaglia, « Generating a Variable from the Tail of the Normal Distribution », ASQC and the American Statistical Association,‎ (lire en ligne [PDF])

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]