Apprendre à réaliser des simulations aléatoires en Python

Mise en œuvre de générateurs de nombres pseudo-aléatoires

Objectif : apprendre à mettre en œuvre des simulations aléatoires en Python (variables aléatoires, méthode de Monte-Carlo, etc.).

Niveau requis : confirmé

7 commentaires

Article lu fois.

L'auteur

Denis Hulo

L'article

Publié le 2 juin 2025 - Mis à jour le 27 août 2025

Public visé : confirmé

Version PDF Version hors-ligne

ePub, Azw et Mobi

Liens sociaux

I. Introduction▲

Le module random permet de générer des nombres pseudo-aléatoires selon différentes lois de probabilité, comme la loi uniforme ou la loi normale.

Ces nombres ne sont pas réellement aléatoires : ils sont produits par un algorithme et, de ce fait, restent en théorie prévisibles. C’est pour cette raison qu’on parle de nombres pseudo-aléatoires.

Nous commencerons par découvrir quelques fonctions essentielles du module random, puis nous les mettrons en pratique à travers diverses simulations : lancer de pile ou face, génération de variables aléatoires, et encore d’autres exemples.

Enfin, nous irons plus loin en concevant notre propre générateurs de nombres pseudo-aléatoires, que nous testerons à l’aide d’une méthode de Monte-Carlo.

Pour alléger la lecture, nous utiliserons parfois le terme nombres aléatoires à la place de nombres pseudo-aléatoires.

II. Module random▲

Outre sa fonction de base random(), ce module propose également des méthodes pour générer des entiers au hasard ou sélectionner des éléments dans une séquence.

II-A. Fonctions de base▲

II-A-1. seed()▲

La fonction random.seed(a=None, version=2) permet d'initialiser le générateur de nombres aléatoires avec une valeur appelée la graine (seed en anglais) :

Sélectionnez

>>> import random
>>> 
>>> # initialise le générateur en utilisant l'heure système ou un générateur aléatoire physique
>>> random.seed()

Si a est omis ou égal à None, l'heure système actuelle est utilisée. Si des sources aléatoires sont fournies par le système d'exploitation, elles sont utilisées à la place de l'heure système (voir la fonction os.urandom() pour les détails sur la disponibilité). Si a est un entier, il est utilisé directement.

La graine est souvent générée à partir de l'état du système. Par exemple, en lisant la valeur de l'horloge, ou bien d'un générateur de nombres aléatoires physique (les mouvements de la souris, ou un bruit électronique).

II-A-2. random()▲

Presque toutes les fonctions du module dépendent de la fonction de base random(), qui génère un nombre aléatoire à virgule flottante dans l'intervalle [0.0, 1.0[.

Elle implémente l'algorithme de Mersenne Twister et peut être appelée ainsi :

Sélectionnez

>>> # tire au hasard un nombre à virgule flottante dans l'intervalle 0.0 ≤ x < 1.0.
>>> random.random()
0.5317718825456861

Ce générateur produit toujours la même suite de nombres à partir d’une valeur initiale donnée. Ainsi, toute personne connaissant cette valeur de départ et l’algorithme utilisé peut prévoir les résultats. C’est pourquoi ce type de générateur n’est pas adapté à tous les usages, en particulier en cryptographie.

II-B. Fonctions pour les entiers▲

Le module random contient également des méthodes permettant de générer des entiers au hasard.

II-B-1. randrange()▲

L'appel à random.randrange(start, stop[, step]) renvoie un nombre entier pris au hasard dans range(start, stop, step):

Sélectionnez

>>> # tire un entier au hasard dans la séquence 0, 2, 4, 6, 8
>>> random.randrange(0, 10, 2)
4

Cela équivaut à peu près à random.choice(range(start, stop, step)),mais accepte des séquences d'entiers étendues et c’est optimisé pour les cas courants.

II-B-2. randint()▲

L'appel à random.randint(a, b) renvoie un nombre entier pris au hasard entre a et b inclus :

Sélectionnez

>>> # tire au hasard un entier compris entre 1 et 10 inclus
>>> random.randint(1, 10)
7

II-C. Fonctions pour les séquences▲

Nous allons maintenant présenter des fonctions qui permettent de générer au hasard des éléments (nombres, caractères, etc.) à partir de séquences.

II-C-1. Fonction choice()▲

random.choice(seq) renvoie un élément aléatoire de la séquence non vide seq. Si seq est vide, lève IndexError :

Sélectionnez

>>> seq = ['a','b','c','d','e','f']
>>> random.choice(seq)
'd'

II-C-2. Fonction choices()▲

random.choices(population, weights=None, *, cum_weights=None, k=1) renvoie une liste de k éléments choisis avec remise dans population. Si population est vide, lève IndexError :

Sélectionnez

>>> seq = ['a','b','c','d','e','f']
>>> random.choices(population=seq, k=10) # tirages avec remise de 10 éléments dans seq
['e', 'b', 'b', 'f', 'e', 'a', 'a', 'b', 'f', 'c']

Un tirage « avec remise » signifie que l'élément n'est pas retiré de la liste (contrairement à sans remise).

II-C-3. Fonction shuffle()▲

Mélange la séquence x sans créer de nouvelle instance (« sur place ») :

Sélectionnez

>>> x = ['a','b','c','d','e','f']
>>> random.shuffle(x)
['c', 'e', 'f', 'b', 'a', 'd']

On réalise ici une permutation au hasard des éléments de x.

Notez que même pour des valeurs de len(x) relativement petites, le nombre total de permutations de x peut rapidement devenir plus grand que la période de la plupart des générateurs de nombres aléatoires. Cela implique que la plupart des permutations d'une longue séquence ne peuvent jamais être générées. Par exemple, une séquence de longueur 2080 est la plus grande qui puisse tenir dans la période du générateur de nombres aléatoires Mersenne Twister.

II-C-4. Fonction sample()▲

random.sample(population, k, *, counts=None) renvoie une liste de k éléments choisis dans population sans remise. Si population est vide, lève IndexError.

La fonction peut être appelée comme ceci :

Sélectionnez

>>> seq = ['a','b','c','d','e','f']
>>> random.sample(population=seq, k=5) # tirages sans remise de 5 éléments dans seq
['e', 'c', 'a', 'd', 'f']

II-D. Distributions pour les nombres réels▲

En plus de la fonction de base random() qui génère un nombre réel (entre 0 et 1) suivant une loi uniforme, ce module propose d'autres distributions pour ces nombres :

II-D-1. Distribution de Gauss▲

La fonction random.gauss(mu=0.0, sigma=1.0) permet de simuler une variable de Gauss d'espérance mu et d'écart-type sigma.

Le code suivant génère une séquence de 100 valeurs suivant une loi normale :

Sélectionnez

import random
            
# moyenne m et écart-type s de la loi normale
m = 40; s = 4.5
    
# génère une séquence de 100 valeurs suivant une loi normale N(m,s^2)
x = [random.gauss(mu=m, sigma=s) for _ in range(100)]

Voir aussi la fonction normalvariate du même module.

III. Simulations aléatoires▲

Voyons maintenant comment utiliser ces fonctions à travers quelques exemples concrets de simulation.

III-A. Simuler un jeu de pile ou face▲

Le pile ou face est un jeu de hasard se jouant avec une pièce de monnaie. Le principe du jeu est de lancer en l'air une pièce équilibrée et de parier sur le côté sorti. La pièce tournoyante tombe au sol et s'y stabilise, ou bien elle est rattrapée d'une main et posée à plat dans l'autre main.

Nous allons utiliser la fonction choice pour simuler un jeu de pile ou face, où chaque pile rapporte 1 point au joueur n°1 et chaque face 1 point au joueur n°2.

III-A-1. Tirage de pile ou face▲

La fonction choice() va permettre d'effectuer un tirage aléatoire dans la liste ["Pile", "Face"] simulant ainsi un jeu de pile ou face :

Sélectionnez

# tirage de pile ou face
resultat = random.choice(["Pile","Face"])

III-A-2. Simulation du jeu▲

Dans notre exemple, nous réalisons un tirage de pile ou face tant que l’utilisateur choisit de poursuivre le jeu (tirage == 'o'), en affichant à chaque étape les scores des joueurs :

Sélectionnez

import random

print("III-A. Simuler un jeu de pile ou face\n")

# initialisation des compteurs : compteur joueur n°1, compteur joueur n°2, compteur de tirages
cpt_joueur1 = 0; cpt_joueur2 = 0; cpt_tirages = 0

# saisie des noms des joueurs
nom_joueur1 = input("Nom du joueur n°1 (Pile) : ")
nom_joueur2 = input("Nom du joueur n°2 (Face) : ")

print()

# tirage ('o': oui, 'n': non)
tirage = input("Commencer le jeu ? (o/n) : ")

print()

# initialisation du générateur de nombres pseudo-aléatoires
random.seed()
 
# réalisation de tirages successifs de pile ou face tant que tirage = "o"
while tirage=="o":
    
    # incrémentation du compteur de tirages
    cpt_tirages += 1 

    print("-- Lancé n°{0} --\n".format(cpt_tirages))
    
    # tirage de pile ou face
    resultat = random.choice(["Pile","Face"])

    print("Résultat : ", resultat)

    # si pile
    if resultat=="Pile":
        cpt_joueur1 += 1 # incrémente le compteur du joueur n°1
    else: # sinon    
        cpt_joueur2 += 1 # incrémente le compteur du joueur n°2

    print()

    # affiche les scores    
    print("{0} : {1} points".format(nom_joueur1, cpt_joueur1))
    print("{0} : {1} points".format(nom_joueur2, cpt_joueur2))

    print()

    # poursuit-on le jeu ? ('o': oui, 'n': non)
    tirage = input("Poursuivre le jeu ? (o/n) : ")
    
    print()

# affiche le résultat du jeu
if cpt_joueur1>cpt_joueur2: # joueur n°1 gagne
    print('{0} gagne avec {1} points sur {2} possibles !'.format(nom_joueur1, cpt_joueur1, cpt_tirages))
else: # sinon
    if cpt_joueur1<cpt_joueur2: # joueur n°2 gagne
        print('{0} gagne avec {1} points sur {2} possibles !'.format(nom_joueur2, cpt_joueur2, cpt_tirages))
    else: # égalité
        print('Egalité entre les deux joueurs : {0} points chacun !'.format(cpt_joueur1))

L'exécution du code affiche :

Sélectionnez

III-A. Simuler un jeu de pile ou face

Nom du joueur n°1 (Pile) : Florent
Nom du joueur n°2 (Face) : Olivier

Commencer le jeu ? (o/n) : o

-- Lancé n°1 --

Résultat : Pile

Florent : 1 points
Olivier : 0 points

Poursuivre le jeu ? (o/n) : o

-- Lancé n°2 --

Résultat : Pile

Florent : 2 points
Olivier : 0 points

Poursuivre le jeu ? (o/n) : o

-- Lancé n°3 --

Résultat : Face

Florent : 2 points
Olivier : 1 points

Poursuivre le jeu ? (o/n) : o

-- Lancé n°4 --

Résultat : Pile

Florent : 3 points
Olivier : 1 points

Poursuivre le jeu ? (o/n) : n

Florent gagne avec 3 points sur 4 possibles !

III-B. Simuler une gaussienne▲

La loi normale (ou loi de Laplace-Gauss) est une loi de probabilité continue qui dépend de deux paramètres : son espérance, un nombre réel noté μ, et son écart-type, un nombre réel positif noté σ. La densité de probabilité de la loi normale d'espérance μ et d'écart-type σ est donnée par :

kitxmlcodelatexdvpf(x) = \frac{1}{\sigma\sqrt{2\pi}} \ e^{\textstyle -\frac{1}{2} {\left(\frac{x - \mu}{\sigma}\right)}^2}finkitxmlcodelatexdvp

Parmi les lois de probabilité, les lois normales prennent une place particulière grâce au théorème central limite. En effet, elles correspondent au comportement, sous certaines conditions, d'une suite d'expériences aléatoires similaires et indépendantes lorsque le nombre d'expériences est très élevé. Grâce à cette propriété, une loi normale permet d'approcher d'autres lois comme la loi binomiale et ainsi de modéliser de nombreuses études scientifiques comme des mesures d'erreurs ou des tests statistiques, en utilisant par exemple les tables de la loi normale centrée réduite.

Nous allons maintenant simuler une variable aléatoire suivant une loi normale, puis représenter sur un graphique la répartition des valeurs obtenues.

III-B-1. Génération de la séquence des valeurs▲

La fonction gauss() du module random va nous permettre d'obtenir une séquence de valeurs suivant une loi normale :

Sélectionnez

import random
...            
# nombre de valeurs générées
k = 100000

# série de k valeurs suivant une loi normale
for i in range(k):

    # génère un nombre aléatoire à l'aide de la fonction gauss()
    xi = random.gauss(μ,σ)
    ...

III-B-2. Simulation de la gaussienne▲

L'objectif va être de générer un graphique en Python afin de montrer que les valeurs obtenues à l'aide de la fonction gauss() se répartissent bien suivant une courbe de Gauss.

Déroulé du code mis en œuvre :

Initialisation des paramètres μ et σ de la loi normale ;
Création de la liste des valeurs en abscisse et initialisation des valeurs en ordonnées ;
Tirage de k nombres réels suivant une loi normale N(μ,σ²) (k très grand) ;
Traçage du graphique représentant la distribution de Gauss et les fréquences d'apparition de chaque valeur de x.

Ce qui donne :

Sélectionnez

import random
import numpy as np
import math
import matplotlib.pyplot as plt
from scipy.stats import norm

print("III-B. Simuler une gaussienne\n")

# nombre d'épreuves de Bernoulli
n = 80

# probabilité de succès
p = 0.5

# moyenne μ et écart-type σ de la loi normale : N(μ,σ^2)≃ B(n,p)
μ = n*p
σ = math.sqrt(n*p*(1-p))

print("Espérance, μ =", μ)
print("Écart-type, σ =", σ)

# écart entre deux valeurs consécutives
h = 0.5

# produit la séquence des x : 0 -> n avec un pas de h
x = np.arange(0, n+1, h)
y = np.array([0]*len(x)) # [0, ..., 0]

print()
print("Tirage des valeurs suivant la loi normale ...")

# nombre de valeurs générées : simulation d'une variable de Gauss
k = 1000000

# initialisation du générateur de nombres pseudo-aléatoires
random.seed()

# série de k valeurs suivant une loi normale N(μ,σ^2)
for _ in range(k):
    
    # génère un nombre aléatoire à l'aide de la fonction gauss()
    xi = random.gauss(μ,σ)
    
    # détermination de l'indice de la valeur dans la liste x
    i = round(xi/h) # x[i] - h/2 ≤ xi ≤ x[i] + h/2

    # incrémentation du compteur de la valeur d'indice i
    y[i] += 1

# calcul de la moyenne des valeurs en tenant compte de leur poids
m = np.average(x, weights=y)
 
# calcul de la variance des valeurs en tenant compte de leur poids
v = np.average((x-m)**2, weights=y)
 
# calcul de l'écart-type
s = math.sqrt(v)
 
print()
print("Moyenne observée =", m)
print("Écart-type observé =", s)

print()
print("Génération du graphique ...")

# division des effectifs par le nombre k de tirages
y = y/k

# nom et dimension de la figure contenant le graphique
plt.figure(num="Figure : Loi normale", figsize=(8, 5), dpi=80)

# trace la courbe de Gauss
plt.plot(x, h*norm.pdf(x,μ,σ), color="red", label='Loi normale N(μ,σ' + chr(0x00B2) + ')')

# trace les barres correspondant aux fréquences observées
plt.bar(x, y, width = h, color="white", edgecolor = 'blue', label='fréquences observées')

# limites sur l'axe des x : [μ - 4σ, μ + 4σ]
plt.xlim(μ - 4*σ, μ + 4*σ)

# limite inférieure sur l'axe des y
plt.ylim(0)

plt.title("Simulation d'une variable de Gauss")

# ajout de la légende
plt.legend()

# affiche le graphique
plt.show()

L'exécution du code affiche :

Sélectionnez

III-B. Simuler une gaussienne

Espérance, μ = 40.0
Écart-type, σ = 4.47213595499958

Tirage des valeurs suivant la loi normale ...

Moyenne observée = 40.000915
Écart-type observé = 4.478495357011661

Génération du graphique ...

Puis le graphique :

Le graphique nous montre que les barres correspondant aux fréquences obtenues (barres au contour bleu) s'ajustent très bien avec la courbe représentant la distribution de la loi normale (en rouge). La simulation est donc très bonne pour un grand nombre de tirages.

III-C. Simuler un échantillonnage aléatoire▲

D'après Wikipedia, en statistiques, l'échantillonnage ou le sondage, désigne les méthodes de sélection d'un sous-ensemble d'individus (un échantillon) à l'intérieur d'une population pour estimer les caractéristiques de l'ensemble de la population. Cette méthode présente plusieurs avantages : une étude restreinte sur une partie de la population, un moindre coût, une collecte des données plus rapide que si l'étude avait été réalisée sur l'ensemble de la population, la réalisation de contrôles destructifs, etc.

Les résultats obtenus constituent un échantillon. Sur un échantillon, on peut calculer différents paramètres statistiques de position (moyenne, etc.) ou de dispersion (écart-type, etc.) issus de la statistique descriptive, de la même manière que l'on peut déterminer des paramètres statistiques d'une population par son recensement exhaustif.

Pour garantir une bonne représentation, il s'agit en général d'un échantillon aléatoire.

Dans notre cas, nous allons simuler ce type de tirage en utilisant les fonctions gauss() et sample().

III-C-1. Création de la population▲

Le principe est d'utiliser la fonction gauss() du module random afin de générer une population de taille N suivant une distribution de Gauss :

Sélectionnez

# création de la  population suivant une loi normale de moyenne μ et d'écart-type σ.
population = [random.gauss(mu=μ, sigma=σ) for _ in range(N)]

III-C-2. Tirage d'un échantillon▲

La fonction sample() va nous permettre ensuite d'effectuer un tirage sans remise de n valeurs dans population :

Sélectionnez

# tirage sans remise d'un échantillon de taille n dans population
echantillon = random.sample(population, k=n)

III-C-3. Simulation du tirage▲

Nous allons maintenant simuler le tirage d’un échantillon au sein d’une population suivant une loi normale.

Déroulé du code mis en œuvre :

Initialisation des paramètres μ et σ de la loi normale : valeurs recherchées ;
Création de la population de base suivant la loi normale ;
Tirage sans remise de n individus dans la population de taille N ;
Évaluation de la moyenne et de l'écart-type de l'échantillon obtenu.

Ce qui donne :

Sélectionnez

import random
import numpy as np
import math

print("III-C. Simuler un échantillonnage aléatoire sur une population suivant une loi normale\n")

# taille de la population totale
N = 45000000

# taille moyenne des français et écart-type (valeurs inconnues utilisées pour la simulation)
μ = 175
σ = 7.2

print("Paramètres de la distribution de Gauss (valeurs recherchées) :\n")

print("Taille moyenne des français ≈", μ)
print("Écart-type ≈", σ)

print()
print("Création de la population de base de taille N = {0} ...\n".format(N))

# initialisation du générateur de nombres pseudo-aléatoires
random.seed()

# création de la  population de base : tailles des français
# en supposant que leur taille se répartisse suivant une loi normale de moyenne μ et d'écart-type σ.
population = [random.gauss(mu=μ, sigma=σ) for _ in range(N)]

# taille de l'échantillon
n = 1000

print("Tirage d'un échantillon de n = {0} individus".format(n))

# initialisation du générateur de nombres pseudo-aléatoires
random.seed()
 
# tirage sans remise d'un échantillon de dimension n dans population
echantillon = random.sample(population, k=n)

print()  
print("Échantillon représentatif :")
 
# échantillon représentatif
print(echantillon)

print()

# calcul de la moyenne et de l'écart-type de l'échantillon
m = np.mean(echantillon)
s = np.std(echantillon)

print("Moyenne de l'échantillon =", m)

# intervalle de confiance sur la moyenne à 99,7 %
print("Intervalle de confiance à 99.7 % =", [m - 3*s/math.sqrt(n), m + 3*s/math.sqrt(n)])

print()

print("Écart-type de l'échantillon =", s)

Dans la réalité, la moyenne et l’écart-type de la population ne sont bien sûr pas connus. Ici, ces paramètres servent avant tout à générer la population de base avec la fonction gauss() et constituent également des valeurs de référence pour les comparer à la moyenne et à l’écart-type de l’échantillon.

L'intervalle kitxmlcodeinlinelatexdvp[m-3\frac{s}{\sqrt{n}};m+3\frac{s}{\sqrt{n}}]finkitxmlcodeinlinelatexdvp est un intervalle de confiance de la moyenne m à environ 99,7 %. Cela veut dire qu'il y a environ 99,7 % de chances que la vraie valeur de la moyenne soit dans cet intervalle. Plus la taille de l'échantillon augmente, plus sa moyenne devrait être proche de celle de la population.

L'exécution du code affiche :

Sélectionnez

III-C. Simuler un échantillonnage aléatoire sur une population suivant une loi normale

Paramètres de la distribution de Gauss (valeurs recherchées) :

Taille moyenne des français ≈ 175
Écart-type ≈ 7.2

Création de la population de base de taille N = 45000000 ...

Tirage d'un échantillon de n = 1000 individus

Échantillon représentatif :
[177.7548635176891, 172.95797319858872, 189.45775722849214, 173.29714340318452, 182.44108042734678, 180.090200994285, 187.1911861793668, 182.2286639672886, 164.66804791571886, 187.23141106882252,...]

Moyenne de l'échantillon = 175.00715275211775
Intervalle de confiance à 99.7 % = [174.3199453578896, 175.6943601463459]

Écart-type de l'échantillon = 7.24380196890074

La moyenne et l'écart-type de l'échantillon obtenu sont donc très proches des paramètres de la fonction gauss() ayant servie à créer la population de base.

III-D. Créer et tester son propre générateur de nombres aléatoires▲

Pour conclure, nous allons créer notre propre générateur de nombres pseudo-aléatoires afin de mieux comprendre le fonctionnement d’un PRNG (pseudorandom number generator) et l’importance de ses paramètres clés, comme la graine ou la période. Nous montrerons ensuite comment le tester à l’aide d'une simulation de Monte-Carlo.

III-D-1. Les PRNG en général▲

Ces algorithmes génèrent, à partir d'une ou de plusieurs valeurs initiales et souvent à l'aide d'une relation de récurrence, toujours la même suite de nombres. Chaque terme produit peut être associé à un état du générateur (valeur du terme et éventuellement de termes précédents, etc.) qui dépend entièrement du précédent. Si un état apparaît une deuxième fois, toute la suite se reproduit à partir de cet état. La période est alors égale au nombre de valeurs générées entre deux états identiques.

Il est évident que l'on va chercher à obtenir une suite de nombres qui se répartissent toujours bien suivant une loi uniforme et ceci sur une période la plus longue possible. Par exemple, l'algorithme de Mersenne Twister réputé pour sa qualité possède une période constante égale à 219937-1.

La qualité des sorties augmente aussi souvent au détriment de la vitesse de génération et ces paramètres doivent également être considérés lors de l'utilisation d'un générateur.

Dans notre cas, on va choisir de créer un générateur congruentiel linéaire, car il est facile à mettre en œuvre et généralement de bonne qualité sous réserve bien sûr de choisir les bons paramètres.

III-D-2. Générateur congruentiel linéaire▲

D'après Wikipedia, un générateur congruentiel linéaire (LCG : linear congruential generator en anglais) est un générateur de nombres pseudo-aléatoires dont l'algorithme, introduit en 1948 par Derrick Lehmer, est basé sur des congruences et une fonction affine.

Les nombres pseudo-aléatoires forment une suite dont chaque terme dépend du précédent, selon la formule :

kitxmlcodeinlinelatexdvpX_{n+1}=(aX_{n}+c)\mod mfinkitxmlcodeinlinelatexdvp

où a est le multiplicateur, c l'incrément et m le module.

Le terme initial s est appelé la graine (seed en anglais). C'est elle qui va permettre de générer une suite apparemment aléatoire. Pour chaque graine, on aura une nouvelle suite. Cependant, il est possible que certaines graines permettent d'obtenir une suite plus aléatoire que d'autres.

Les termes de cette suite sont donc compris entre 0 et m−1. De plus, comme chaque terme dépend entièrement du précédent, si un nombre apparaît une deuxième fois, toute la suite se reproduit à partir de ce nombre. La période, c'est-à-dire le nombre de valeurs que produit le générateur avant de recommencer la même séquence, est donc dans ce cas au maximum de m.

Le module est souvent choisi de manière à être de l’ordre de la longueur des mots sur l’ordinateur (par exemple : 232 sur une machine 32 bits). En effet, les ordinateurs calculant naturellement en base binaire, cela évite une division euclidienne dans le calcul du modulo (opération souvent coûteuse en temps de calcul).

La période est donc relativement courte, mais cette méthode présente un avantage : on connaît les critères sur les nombres a, c et m qui vont permettre d’obtenir une période maximale (égale à m).

Pour plus de détails, vous pouvez consulter cette page WikipediaGénérateur congruentiel linéaire.

III-D-3. Classe Random▲

Notre générateur congruentiel linéaire est défini à l'aide d'une classe Random :

III-D-3-a. Méthode constructeur init()▲

Cette méthode est exécutée au moment de créer l'objet Random, c'est-à-dire quand la classe est instanciée.

Elle permet d'initialiser le générateur de nombres aléatoires en mettant à jour l'attribut x avec la valeur initiale :

Sélectionnez

class Random():
    # classe permettant de définir le générateur congruentiel linéaire (LCG)
    
    def __init__(self, s=None):
        # s : valeur initiale ou graine (seed)

        # self.x = s or int(time.time())
        self.x = s if s else int(time.time())

L'attribut x est accessible et modifiable depuis toutes les méthodes de la classe.

III-D-3-b. Méthode rand()▲

À l'instar de la fonction random() du module random, elle permet de générer un nombre aléatoire à virgule flottante dans l'intervalle [0.0, 1.0[.

Elle se base sur la relation de récurrence vu précédemment kitxmlcodeinlinelatexdvpX_{n+1}=(aX_{n}+c)\mod mfinkitxmlcodeinlinelatexdvp :

Sélectionnez

class Random():
    # classe permettant de définir le générateur congruentiel linéaire (LCG)
    ....
    
    def rand(self):
        # méthode permettant de générer un nombre aléatoire entre 0 et 1

        # paramètres du générateur :  m : module ; a : multiplicateur; c : incrément
        m=2147483648; a=1103515245; c=12345
        
        # formule de récurrence pour le LCG : Xn+1 = (aXn + c) mod m
        self.x = (a * self.x + c) % m

        # renvoie la nouvelle valeur pour x divisé par le module m
        return self.x/m

Les valeurs de m, a et c sont également celles utilisées par le générateur d'UNIX : 2³¹, 1103515245 et 12345.

La classe Random propose également une méthode init_rand() pour initialiser le générateur de nombres aléatoires après la création de l’objet, ainsi qu’une fonction rand_int(lower, upper) qui génère un entier aléatoire dans l’intervalle indiqué. Bien sûr, chacun reste libre d’enrichir cette classe en y ajoutant d’autres méthodes.

III-D-4. Test du générateur à l'aide d'une simulation de Monte-Carlo▲

Une méthode de Monte-Carlo consiste à calculer une valeur numérique approchée en utilisant un procédé aléatoire. Elle est particulièrement utilisée pour le calcul de surfaces ou de volumes.

Soit un cercle de centre 0 et de rayon 1, inscrit dans un carré de côté 2.

On considère maintenant un quart de ce cercle inscrit dans un petit carré de côté 1.

Le procédé aléatoire va consister à tirer au hasard (et successivement) un grand nombre de points dans le petit carré et à compter le nombre de points situés dans le quart de cercle :

En faisant le rapport du nombre de points situés dans le cercle sur le nombre total de tirages, on doit obtenir une valeur approchée du rapport entre la surface du cercle et celle du carré, c'est à dire Pi/4.

Pour avoir plus de détails, vous pouvez consulter cette page WikipediaMéthode de Monte-Carlo.

III-D-4-a. Fonction Test▲

Soit un point M de coordonnées (x,y), où kitxmlcodeinlinelatexdvp0\lt x \lt 1finkitxmlcodeinlinelatexdvp et kitxmlcodeinlinelatexdvp0\lt y \lt 1finkitxmlcodeinlinelatexdvp. On tire aléatoirement les valeurs de x et y avec notre méthode rand(). Le point M appartient au disque de centre (0,0) de rayon 1 si et seulement si kitxmlcodeinlinelatexdvpx^{2} + y^{2} \le 1finkitxmlcodeinlinelatexdvp. La probabilité que le point M appartienne au disque est donc Pi/4.

Donnons maintenant le déroulé de la fonction test :

1. Création de l'objet Random et initialisation du générateur de nombres aléatoires ;
2. Pour i=0 jusqu'à n-1 faire :
--- 2.1. Tirage aléatoire des coordonnées (x,y) du point M et ajout du point à la liste ;
--- 2.2. Incrémentation du compteur si le point est dans le cercle ;
3. Renvoi de la valeur de (cpt / n) * 4 comme approximation de Pi et de la liste des points.

On obtient ainsi le code :

Sélectionnez

def test_rand(n):
    # n : nombre de tirages

    # création de l'objet Random avec les paramètres par défaut : initialisation du générateur de nombres pseudo-aléatoires
    rand_lcg = Random()

    # initialisation du compteur et de la liste des points
    cpt = 0; points=[]
        
    # réalisation d'un tirage de n points dans le carré de côté 1
    for i in range(n):

        # tirage au hasard de la coordonnée x
        x = rand_lcg.rand()
        
        # tirage au hasard de la coordonnée y
        y = rand_lcg.rand()

        # ajout du point à la liste
        points.append((x,y))
        
        # test si le point de coordonnées (x,y) est dans le cercle
        if x*x + y*y <= 1:
           # si oui on incrémente le compteur 
           cpt +=  1 

    # renvoie la valeur approximation de Pi : (cpt / n) * 4, et la liste des points tirés au hasard
    return ((cpt / n) * 4, points)

On crée l'objet Random au début ce qui initialise aussi le générateur de nombres aléatoires.

III-D-4-b. Simulation de Monte-Carlo▲

Nous allons maintenant tester notre générateur à l’aide de la méthode de Monte-Carlo décrite précédemment, et visualiser sur un graphique la répartition uniforme des points dans le carré :

Sélectionnez

import numpy as np
import matplotlib.pyplot as plt
                        
# 3 tests successifs de notre générateur en faisant varier n : 1000, 10 000, 100 0000
for i in range(3, 6):

    # valeur de n : 10^(i)
    n = pow(10,i)

    print()

    print("Test n°{0} : ".format(i-2)) 
    print("Nombre de points choisis au hasard =", n)

    # calcul approché de Pi à l'aide d'une méthode de Monte-Carlo.
    pi, points = test_rand(n)
 
    print("Approximation de Pi = ", pi)
    print("Erreur absolue = ", abs(pi-math.pi))

    # tri des points en fonction des x
    points.sort()

    # création des tableaux numpy x et y à partir des points
    x = np.array([p[0] for p in points])
    y = np.array([p[1] for p in points])

    # nom et dimension de la figure contenant le graphique
    plt.figure(num="Simulation de Monte-Carlo : calcul de Pi", figsize=(7, 6), dpi=80) 
    
    # même échelle sur l'axe des x et des y
    plt.axis('scaled')

    # trace le quart de cercle en rouge
    plt.plot(x, np.sqrt(1-x*x), color="red")

    # trace les points tirés au hasard
    plt.scatter(x, y, s=0.5)

    # limites inférieures et supérieures sur l'axe des x et des y
    plt.xlim(0, 1); plt.ylim(0, 1)

    # affiche le graphique
    plt.show()

Le code affiche :

Sélectionnez

Test n°1 :
Nombre de points choisis au hasard = 1000
Approximation de Pi = 3.196
Erreur absolue = 0.05440734641020706

Puis :

Sélectionnez

Test n°2 :
Nombre de points choisis au hasard = 10000
Approximation de Pi = 3.162
Erreur absolue = 0.020407346410206806

Et enfin :

Sélectionnez

Test n°3 :
Nombre de points choisis au hasard = 100000
Approximation de Pi = 3.14572
Erreur absolue = 0.004127346410206734

À l’exécution, on observe que la fonction converge bien vers Pi à mesure que le nombre de tirages augmente. On constate également sur les différents graphiques que les points se répartissent de manière approximativement uniforme sur le carré de côté 1.

Il m’a semblé intéressant d’accompagner l’estimation de Monte-Carlo (approche de Pi) d’une représentation graphique des points sur le carré, afin de mieux visualiser leur répartition. Cependant, je reste conscient des limites de cette méthode : en réalité, il serait nécessaire de réaliser une analyse statistique plus poussée, prenant en compte d’autres paramètres comme la période, pour détecter d’éventuels défauts du générateur.

IV. Conclusion▲

Nous arrivons ainsi au terme de cet article. Nous avons d’abord découvert les principales fonctions du module random, puis appris à les mettre en pratique à travers différentes simulations (pile ou face, échantillonnage aléatoire, etc.). Enfin, nous avons proposé au lecteur de concevoir son propre générateur de nombres pseudo-aléatoires et de le tester grâce à une méthode de Monte-Carlo.

Ces générateurs restent, dans bien des cas, plus simples à utiliser et plus efficaces que les générateurs de « vrais » nombres aléatoires. Toutefois, il est important de garder à l’esprit que leur usage peut se révéler inadapté dans certaines situations. C’est notamment le cas en cryptologie, où les clés de chiffrement doivent être parfaitement aléatoires afin de garantir un haut niveau de sécurité. Dans ce contexte, on privilégiera des solutions plus sûres, comme le module secrets ou encore la fonction urandom() du module os.

V. Téléchargement▲

Le fichier compresséfichier de test contenant le module Python pour effectuer les différents tests.

VI. Remerciements▲

Je tiens à remercier f-leb et Laurent Ott pour leur contribution à la rédaction de cet article, ainsi que escartefigue pour sa relecture.

Sources

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants :

Copyright © 2025 Denis Hulo. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts. Droits de diffusion permanents accordés à Developpez LLC.

Apprendre à réaliser des simulations aléatoires en Python

Mise en œuvre de générateurs de nombres pseudo-aléatoires

L'auteur

L'article

Liens sociaux

I. Introduction▲

II. Module random▲

II-A. Fonctions de base▲

II-A-1. seed()▲

II-A-2. random()▲

II-B. Fonctions pour les entiers▲

II-B-1. randrange()▲

II-B-2. randint()▲

II-C. Fonctions pour les séquences▲

II-C-1. Fonction choice()▲

II-C-2. Fonction choices()▲

II-C-3. Fonction shuffle()▲

II-C-4. Fonction sample()▲

II-D. Distributions pour les nombres réels▲

II-D-1. Distribution de Gauss▲

III. Simulations aléatoires▲

III-A. Simuler un jeu de pile ou face▲

III-A-1. Tirage de pile ou face▲

III-A-2. Simulation du jeu▲

III-B. Simuler une gaussienne▲

III-B-1. Génération de la séquence des valeurs▲

III-B-2. Simulation de la gaussienne▲

III-C. Simuler un échantillonnage aléatoire▲

III-C-1. Création de la population▲

III-C-2. Tirage d'un échantillon▲

III-C-3. Simulation du tirage▲

III-D. Créer et tester son propre générateur de nombres aléatoires▲

III-D-1. Les PRNG en général▲

III-D-2. Générateur congruentiel linéaire▲

III-D-3. Classe Random▲

III-D-3-a. Méthode constructeur __init__()▲

III-D-3-b. Méthode rand()▲

III-D-4. Test du générateur à l'aide d'une simulation de Monte-Carlo▲

III-D-4-a. Fonction Test▲

III-D-4-b. Simulation de Monte-Carlo▲

IV. Conclusion▲

V. Téléchargement▲

VI. Remerciements▲

III-D-3-a. Méthode constructeur init()▲