Paradoxe des deux enfants

Un article de Wikipédia, l'encyclopédie libre.

En théorie des probabilités, le paradoxe des deux enfants consiste à estimer le sexe d'un enfant parmi deux à partir de l'observation de l'autre, exemple-type d'inférence bayésienne. Il y a paradoxe pour deux raisons : d'une part la bonne réponse (l'autre enfant a davantage de chances d'être de sexe opposé) est contre-intuitive pour beaucoup de personnes, et d'autre part des formulations très voisines du problème mènent à des résultats différents.

Énoncé original[modifier | modifier le code]

Formulation[modifier | modifier le code]

La première occurrence de ce problème est un article de Martin Gardner, paru dans la revue Scientific American en 1959 sous le titre The Two Children Problem[1].

Mr. Jones has two children. The older child is a girl. What is the probability that both children are girls?
Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?
M. Jones a deux enfants. L'enfant aîné est une fille. Quelle est la probabilité que les deux enfants soient des filles ?
M. Smith a deux enfants. Au moins l'un des deux est un garçon. Quelle est la probabilité que les deux enfants soient des garçons ?

Dans cet article, les probabilités étaient évaluées respectivement à 1/2 et 1/3. Cela signifie que, parmi toutes les familles de deux enfants avec une fille en première position, la moitié d'entre elles a en réalité deux filles, tandis que, parmi toutes les familles de deux enfants avec au moins un garçon, un tiers d'entre elles a en fait deux garçons.

Mais Martin Gardner a reconnu plus tard que la seconde question était ambiguë[1]. En effet, la manière dont est acquise l'information selon laquelle il y a au moins un garçon influence la réponse à la question, qui peut alors varier de 1/3 à 1/2.

De nombreuses variantes de ce problème montrent l'importance de la formulation dans le calcul du résultat.

Hypothèses implicites[modifier | modifier le code]

D'une part, les sexes des enfants sont supposés indépendants d'un enfant à l'autre en l'absence d'hypothèse supplémentaire. D'autre part, chaque enfant peut être un garçon ou une fille de façon équiprobable.

Ces hypothèses ne traduisent pas exactement la réalité. D'une part, la possibilité que les enfants soient des jumeaux monozygotes contredit a priori l'indépendance des sexes et fait augmenter légèrement les deux probabilités calculées précédemment[2]. D'autre part, les proportions des deux sexes sont inégales et varient même selon l'âge et le pays[3].

La correction de ces approximations fait varier les probabilités d'au plus quelques pourcents, ce qui ne supprime pas le paradoxe du résultat.

Explication par tableau[modifier | modifier le code]

On distingue les quatre possibilités pour le sexe de deux enfants d'une famille à l'aide d'un tableau à double entrée :

Sexe du deuxième enfant
Fille Garçon
Sexe du premier enfant Fille FF FG
Garçon GF GG

D'après les hypothèses implicites, ces quatre possibilités sont équiprobables. Il suffit alors de déterminer le rapport du nombre de cas favorables par le nombre de cas possibles dans chaque famille.

Dans la famille de M. Jones, les seuls cas possibles sont notés FF et FG, et le seul cas favorable est FF. La probabilité que les deux enfants soient des filles vaut donc 1/2.

Dans la famille de M. Smith, les cas possibles sont FG, GF, et GG, alors que le seul cas favorable est GG. La probabilité que les deux enfants soient des garçons vaut donc 1/3.

Calcul formel avec probabilités conditionnelles[modifier | modifier le code]

Le calcul peut être effectué avec les notations d'événements :

  •  : « le premier enfant est une fille » ;
  •  : « le deuxième enfant est une fille ».
Famille Jones

La probabilité qu'il y ait deux filles dans la famille Jones est alors la probabilité de l'intersection de ces deux événements, sous la condition du premier événement :

or, par indépendance de et

Cette probabilité vaut donc 1/2 d'après les hypothèses implicites.

Famille Smith

La probabilité qu'il y ait deux garçons dans la famille Smith s'écrit :

la dernière égalité se déduisant des propriétés des opérations ensemblistes, notamment d'une des lois de De Morgan. Puis, par passage au complémentaire et indépendance des événements et

Critiques[modifier | modifier le code]

Acquisition de l'information[modifier | modifier le code]

Le calcul effectué précédemment suppose que la famille Smith se retrouve de façon équiprobable dans l'une des trois cases du tableau intitulées FG, GF, et GG. Or l'information selon laquelle il y a au moins un garçon peut être obtenue de différentes manières :

  1. À la question « Avez-vous au moins un garçon ? », M. Smith répond « Oui. » (événement ) ;
  2. À la demande « Indiquez-moi le sexe de l'un de vos enfants. », M. Smith répond « J'ai (au moins) un garçon. » (événement ).

Dans le premier cas, la probabilité qu'il y ait deux garçons correspond effectivement à la probabilité conditionnelle calculée précédemment et qui vaut 1/3. Mais dans le deuxième cas, le fait que M. Smith choisisse de mentionner un garçon affaiblit la probabilité qu'il y ait une fille, sauf à supposer qu'un parent choisit toujours de mentionner un garçon lorsqu'il en a un. En supposant qu'un parent d'un garçon et d'une fille mentionne l'un ou l'autre de façon équiprobable, la probabilité que M. Smith ait deux garçons remonte à 1/2.

Explication par tableaux[modifier | modifier le code]

Le premier cas (« Avez-vous au moins un garçon ? — Oui. ») correspond exactement au tableau donné précédemment. L'information donnée par M. Smith permettant d'éliminer le cas FF du tableau, et les trois autres possibilités étant équiprobables d'après les hypothèses implicites, la probabilité du cas GG est 1/3.

Pour le deuxième cas, on distingue comme précédemment les quatre possibilités de sexe, et on écrit dans le tableau à double entrée ce que M. Smith peut répondre :

Sexe du deuxième enfant
Fille Garçon
Sexe du premier enfant Fille FF
« une fille »
FG
« une fille » ou bien « un garçon »
Garçon GF
« une fille » ou bien « un garçon »
GG
« un garçon »

M. Smith a répondu « un garçon », le cas FF est donc éliminé. M. Smith peut se trouver dans la situation GG, GF, ou bien FG, ces trois situations étant équiprobables et chacune associée à la probabilité 1/3. Si l'autre enfant de M. Smith est une fille (GF ou FG), les deux réponses « un garçon » ou « une fille » sont possibles. En supposant qu'un parent dans cette situation répond sans préférence particulière, la réponse « un garçon » recueille la moitié de la probabilité de chaque situation, soit 1/6 pour GF et 1/6 pour FG, soit 1/3 au total. Si l'autre enfant de M. Smith est un garçon (GG), la réponse « un garçon » a la probabilité de la situation, soit 1/3 également. La probabilité que M. Smith réponde « un garçon » alors qu'il a aussi une fille (GF ou FG) ou alors qu'il a un second garçon (GG) sont donc égales, ce qui fait que la probabilité qu'il ait un second garçon est 1/2.

Calcul formel avec probabilités conditionnelles[modifier | modifier le code]

D'autres manières d'acquérir l'information sur le sexe d'un enfant s'apparentent au deuxième cas, comme la rencontre d'un garçon disant être le fils de M. Smith.

Particularisation[modifier | modifier le code]

Un autre biais de la formulation d'origine pour M. Smith est le recours à l'expression « l'un des deux » qui peut particulariser l'un des enfants de la même manière que le fait l'ordre de naissance. Cette particularisation peut être entérinée par la question « Quelle est la probabilité que l'autre enfant soit un garçon (aussi) ? » qui est parfois utilisée.
En effet, lorsque l’information est ainsi fournie spontanément par le locuteur, on pourra penser qu’il a fait un choix préalable sur l’enfant dont il parle, choix qui pourra être aussi bien volontaire qu'involontaire, ou même dû au hasard.

Exemple : « J’ai deux enfants, l’un est un garçon » peut indiquer que le garçon en question a été choisi par celui qui s’exprime, de manière consciente ou non. Si c’est le cas, la probabilité que l’autre enfant soit (aussi) un garçon est bien 1/2, car à partir du moment où l'un et l'autre sont identifiés, le sexe de « l'autre » est indépendant de l'information fournie.

A l’inverse, il reste possible que l’interlocuteur n’ait pas fait de choix, même avec cette tournure de phrase ; il pourra s’agir par exemple d’un mathématicien ou logicien qui ne fait que livrer (malhabilement, ou très habilement) une information générale sur ses deux enfants, à savoir ici qu’il n’a pas deux filles, auquel cas la probabilité qu’il ait deux garçons est 1/3.

Ce point est celui qui porte le plus souvent à discussion, d’où le terme de paradoxe affublé à ce problème des deux enfants. Il disparaît lorsque l’information fournie résulte d’une réponse à une question fermée. Ainsi dans le dialogue suivant :
— « Avez-vous exactement deux enfants ? »
— « Oui. »
— « Avez-vous au moins un garçon ? »
— « Oui. »,
la particularisation de l’enfant ne peut plus être invoquée, et la probabilité que l’interlocuteur ait deux garçons est bien 1/3.

Variantes[modifier | modifier le code]

Les variantes les plus courantes du paradoxe des deux enfants consistent à joindre une autre information au sexe.

Jour de naissance[modifier | modifier le code]

Lê Nguyên Hoang propose de considérer une famille de deux enfants, dont au moins l'un des enfants est un garçon né un mardi. On se demande quelle est la probabilité que l'autre enfant soit un garçon aussi[4].

On suppose l'équiprobabilité entre les sexes et entre les jours de la semaine ; alors pour chaque enfant, l'événement « être un garçon » a la probabilité et l'événement « être né un mardi » a la probabilité On suppose aussi l'indépendance entre le sexe et le jour de la semaine ; alors « être un garçon né un mardi » a la probabilité « être un garçon né un autre jour » a la probabilité et « être une fille » a la probabilité
On suppose de plus l'indépendance entre les enfants ; alors pour deux enfants, on obtient les probabilités suivantes :

Probabilité a priori Deuxième enfant
Garçon Fille
né un mardi né un autre jour
Premier enfant Garçon né un mardi
né un autre jour
Fille

Sachant que la famille a au moins un garçon né un mardi on peut éliminer les cases qui ne correspondent ni à la première ligne, ni à la première colonne. On obtient alors la probabilité que l'autre enfant soit un garçon aussi sous la condition (la notation «  » signifie « non  ») :

Prénom[modifier | modifier le code]

Jean-Paul Delahaye a présenté le paradoxe suivant, inventé par Jacques Patarin[réf. nécessaire],[5]: déterminer la probabilité que deux enfants soient des filles sachant qu'il y a au moins une fille prénommée Sophie parmi eux[6].

Remarques :

  • Cet énoncé devrait préciser deux autres informations nécessaires à ce calcul : la population (occidentale, francophone...) de laquelle on considère que ces deux enfants font partie, et la proportion de Sophies parmi les filles de cette population ; mais quelle que soit la (grande) population considérée, cette proportion est très proche de 0.
  • Cette information supplémentaire (le prénom Sophie) sur la fille revient à particulariser fortement cette fille, ce qui entraîne que la probabilité cherchée est très proche de 1/2.
  • Cette variante illustre le fait que la particularité (ici, le prénom Sophie) apparue pour l'issue connue (ici, « fille ») peut ne jamais apparaître pour l'issue à laquelle on ne s'intéresse pas (ici, « garçon »).

Généralisation[modifier | modifier le code]

Plus généralement, Jean-Paul Delahaye montre que la probabilité que les deux enfants soient du même sexe sachant qu'au moins l'un d'eux est une fille, avec une particularité ayant la probabilité d’apparaître pour toute fille, est égale à :

Pour tout
donc c.-à-d.

Remarque : 1/2 est le premier résultat du problème original, 1/3 est le deuxième résultat du problème original.

Plus est faible — c.-à-d. plus l'information particularise la fille (comme son prénom) — plus la probabilité est proche de 1/2, tandis que plus est proche de 1 — c.-à-d. que l'information n'apporte pas grand chose — plus la probabilité est proche de 1/3.

Cela peut se comprendre intuitivement, en comparant les probabilités que la particularité apparaisse avec une seule fille et avec deux filles, dans chacun des deux cas :

  • Si est proche de 0, alors la particularité apparaît environ autant avec une seule fille qu'avec deux filles. En effet : c.-à-d. est très proche de 0. D'autre part : donc c.-à-d. Donc
  • Si alors la particularité apparaît environ deux fois plus avec une seule fille qu'avec deux filles. En effet : c.-à-d. (presque comme ). D'autre part :  donc c.-à-d. Donc

Cette formule donnée par Jean-Paul Delahaye est applicable aux différentes versions du problème qui existent. Par exemple, pour celle du jour de naissance (vue plus haut), on constate que la formule donne bien la probabilité déjà calculée :

Autres exemples d’application (Pierre-Henry Ladame) de cette formule :

  • On considère une famille avec deux enfants, dont au moins un des deux enfants est un garçon ayant le même signe astrologique que sa mère. Quelle est la probabilité que l’autre enfant soit aussi un garçon ?
Ici, alors
  • On considère une autre famille avec deux enfants, dont au moins un des deux enfants est un garçon n’ayant pas le même signe astrologique que sa mère. Quelle est la probabilité que l’autre enfant soit aussi un garçon ?
Ici, alors

Extension[modifier | modifier le code]

On peut généraliser le problème pour toute double expérience aléatoire dont les issues possibles sont équiprobables, avec la connaissance d’informations sur au moins une de ces deux expériences.

Avec deux tirages entre issues équiprobables, la connaissance d’une issue pour au moins un des tirages, et la connaissance d'une particularité apparue sur cette issue connue, particularité pouvant apparaître avec la probabilité sur l'issue à laquelle on s'intéresse de chacun des deux tirages, la probabilité que les deux tirages soient d’issues identiques est égale à :

(Pierre-Henry Ladame).

Exemple : On a dix dés (de six faces chacun) dont sept ont les chiffres gravés, les autres les chiffres peints. Les dés sont mélangés ; un dé est choisi au hasard et lancé. Puis les dés sont mélangés à nouveau ; un dé est à nouveau choisi au hasard et lancé. On obtient l’information suivante sur ces deux jets de dé(s) : « il y a eu au moins un As avec chiffre gravé »  ; l’information est reçue dans un mode qui permet d’assurer qu’aucun dé n’a été spécifiquement désigné. Quelle est la probabilité qu’il y ait eu deux As ?

Ici, et alors

Ce résultat aussi peut être confirmé par un calcul direct. Pour chaque jet d'un dé, soit l'issue : « chiffre 2, 3, 4, 5, ou 6 » ;

Notes[modifier | modifier le code]

  1. a et b (en) Martin Gardner, The Second Scientific American Book of Mathematical Puzzles and Diversions, Simon & Schuster, , 254 p. (ISBN 978-0-226-28253-4)
  2. En ce sens, la possibilité que les enfants soient des jumeaux monozygotes n'est a priori pas compensée par celle qu'ils soient des jumeaux dizygotes, car ces derniers peuvent être de même sexe aussi.
  3. Proportion de garçons et de filles selon les âges et les pays
  4. Science4All, « 3 variantes mindfucks des 2 enfants | Bayes 6 », (consulté le )
  5. Jacques Patarin, « Le Paradoxe des Sophies »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le )
  6. Jean-Paul Delahaye, « Le trésor et les Sophies », Pour la science n° 336, octobre 2005.

Articles connexes[modifier | modifier le code]