Paradoxe des deux enfants

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, le paradoxe des deux enfants est un problème de théorie des probabilités évaluant le genre sexuel de deux enfants à partir d'une information sur l'un des deux. La qualification de ce problème comme paradoxe vient du fait que des formulations équivalentes en apparence mènent à des résultats différents.

Énoncé original[modifier | modifier le code]

Formulation[modifier | modifier le code]

La première occurrence de ce problème est un article de Martin Gardner, paru dans la revue Scientific American en 1959 sous le titre The Two Children Problem[1].

Mr. Jones has two children. The older child is a girl. What is the probability that both children are girls?
Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?
M. Jones a deux enfants. L'enfant aîné est une fille. Quelle est la probabilité que les deux enfants soient des filles ?
M. Smith a deux enfants. Au moins l'un des deux est un garçon. Quelle est la probabilité que les deux enfants soient des garçons ?

Dans cet article, les probabilités étaient évaluées respectivement à 1/2 et 1/3. Cela signifie que, parmi toutes les familles de deux enfants avec une fille en première position, la moitié d'entre elles a en réalité deux filles, tandis que, parmi toutes les familles de deux enfants avec au moins un garçon, un tiers d'entre elles a en fait deux garçons.

Mais Martin Gardner a reconnu plus tard que la seconde question était ambiguë[1]. En effet, la manière dont est acquise l'information selon laquelle il y a au moins un garçon influence le résultat qui peut alors varier de 1/3 à 1/2.[pas clair]

De nombreuses variantes de ce problème montrent l'importance de la formulation dans le calcul du résultat.

Hypothèses implicites[modifier | modifier le code]

D'une part les genres des enfants sont supposés indépendants d'un enfant à l'autre en l'absence d'hypothèse supplémentaire. D'autre part, chaque enfant peut être un garçon ou une fille de façon équiprobable.

Ces hypothèses ne traduisent pas exactement la réalité. D'une part, la possibilité que les enfants soient des jumeaux monozygotes contredit a priori l'indépendance des genres et fait augmenter légèrement les deux probabilités calculées précédemment. D'autre part, les proportions des deux genres sont inégales et varient même selon l'âge et le pays[2]. Enfin, la modélisation proposée néglige la possibilité qu'un enfant ne se reconnaisse pas dans l'un des deux genres usuels, comme en cas d'ambiguïté sexuelle.

La correction de ces approximations fait varier les probabilités d'au plus quelques pourcents, ce qui ne change pas le résultat du paradoxe.

Explication par tableau[modifier | modifier le code]

On distingue les quatre possibilités pour le genre de deux enfants d'une famille à l'aide d'un tableau à double entrée :

Genre du deuxième enfant
Fille Garçon
Genre du premier enfant Fille FF FG
Garçon GF GG

D'après les hypothèses implicites, ces quatre possibilités sont équiprobables. Il suffit alors de déterminer le rapport du nombre de cas favorables par le nombre de cas possibles dans chaque famille.

Dans la famille de M. Jones, les seuls cas possibles sont notés FF et FG et le seul cas favorable est FF. La probabilité que les deux enfants soient des filles vaut donc 1/2.

Dans la famille de M. Smith, les cas possibles sont FG, GF et GG, alors que le seul cas favorable est GG. La probabilité que les deux enfants soient des garçons vaut donc 1/3.

Ces calculs reposent sur l'hypothèse fondamentale que les enfants sont discernables[3] et peuvent donc être ordonnés (par exemple par ordre de naissance). L'absence d'une telle hypothèse empêcherait de distinguer les cas FG et GF, ce qui rendrait les calculs plus difficiles à justifier.

Calcul formel avec probabilités conditionnelles[modifier | modifier le code]

Le calcul peut être effectué avec les notations d'événements :

  • F_1 : « le premier enfant est une fille » ;
  • F_2 : « le deuxième enfant est une fille ».
Famille Jones

La probabilité qu'il y ait deux filles dans la famille Jones est alors la probabilité de l'intersection de ces deux événements, sous la condition du premier événement :

P_{F_1}(F_1 \cap F_2) = \frac{P(F_1 \cap(F_1 \cap F_2))}{P(F_1)} = \frac{P(F_1 \cap F_2)}{P(F_1)} = P_{F_1}(F_2)

or, par indépendance de F_1 et F_2,

P_{F_1}(F_2) = P(F_2)\ .

Cette probabilité vaut donc 1/2 d'après les hypothèses implicites.

Famille Smith

La probabilité qu'il y ait deux garçons dans la famille Smith s'écrit :

P_{\overline{F_1} \cup \overline{F_2}}(\overline{F_1} \cap \overline{F_2})
= \frac{P\big((\overline{F_1} \cup \overline{F_2})\cap (\overline{F_1} \cap \overline{F_2})\big)}{P(\overline{F_1} \cup \overline{F_2})}
= \frac{P(\overline{F_1}\cap \overline{F_2})}{P(\overline{F_1 \cap F_2})}\ ,

la dernière égalité se déduisant des propriétés des opérations ensemblistes, notamment d'une des lois de De Morgan. Puis par passage au complémentaire et indépendance des événements F_1 et F_2,

P_{\overline{F_1} \cup \overline{F_2}}(\overline{F_1} \cap \overline{F_2})
= \frac{P(\overline{F_1}) P(\overline{F_2})}{1-P(F_1)P(F_2)} = \frac{0,5^2}{1-0,5^2} = \frac{1/4}{3/4} = \frac{1}{3}\ .

Critiques[modifier | modifier le code]

Acquisition de l'information[modifier | modifier le code]

Le calcul effectué précédemment suppose que la famille Smith se retrouve de façon équiprobable de l'une des trois cases du tableau intitulées FG, GF et GG. Or l'information selon laquelle il y a au moins un enfant peut être obtenue de différentes manières :

  1. À la question « Avez-vous au moins un garçon ? », M. Smith répond « Oui. » (événement A).
  2. À la demande « Indiquez-moi le genre de l'un de vos enfants. », M. Smith répond « J'ai (au moins) un garçon. » (événement B).

Dans le premier cas, la probabilité qu'il y ait deux garçons correspond effectivement à la probabilité conditionnelle calculée précédemment et qui vaut 1/3. Mais dans le deuxième cas, le fait que M. Smith choisisse de mentionner un garçon affaiblit la probabilité qu'il y ait une fille, sauf à supposer qu'un parent choisit toujours de mentionner un garçon lorsqu'il en a un. En supposant qu'un parent d'un garçon et d'une fille mentionne l'un ou l'autre de façon équiprobable, la probabilité que M. Smith ait deux garçons remonte à 1/2.

Explication par tableaux[modifier | modifier le code]

Le premier cas (« Avez-vous au moins un garçon ? — Oui. ») correspond exactement au tableau donné précédemment. L'information donnée par M. Smith permettant d'éliminer le cas FF du tableau, et les trois autres possibilités étant équiprobables d'après les hypothèses implicites, la probabilité du cas GG est 1/3.

Pour le deuxième cas, on distingue comme antérieurement les quatre possibilités de genre, et on écrit dans le tableau à double entrée ce que M. Smith peut répondre :

Genre du deuxième enfant
fille garçon
Genre du premier enfant Fille FF
« une fille »
FG
« une fille » ou bien « un garçon »
Garçon GF
« une fille » ou bien « un garçon »
GG
« un garçon »

Si M. Smith a répondu « un garçon », le cas FF est éliminé. M. Smith peut se trouver dans la situation GG, GF ou bien FG, ces trois situations étant équiprobables et associées à une probabilité d’1/3. Dans la situations où le second enfant est une fille (GF ou FG), les deux réponses « un garçon » ou « une fille » sont possibles. En supposant qu'un parent dans cette situation répond sans préférence particulière, la réponse « un garçon » recueille la moitié de la probabilité de chaque situation, soit 1/6 pour GF et 1/6 pour FG, soit 1/3 au total. La probabilité que M. Smith réponde « un garçon » alors qu'il a une autre fille (GF ou FG) ou alors qu'il a un autre garçon (GG) sont égales, ce qui fait que la probabilité qu'il ait un second garçon est 1/2.

Calcul formel avec probabilités conditionnelles[modifier | modifier le code]

D'autres manières d'acquérir l'information sur le genre d'un enfant s'apparentent au deuxième cas, comme la rencontre d'un garçon disant être le fils de M. Smith.

Particularisation[modifier | modifier le code]

Un autre biais de la formulation d'origine pour M. Smith est le recours à l'expression « l'un des deux » qui peut particulariser l'un des enfants de la même manière que le fait l'ordre de naissance. Cette particularisation peut être entérinée par la question « Quelle est la probabilité que l'autre enfant soit un garçon (aussi) ? » qui est parfois utilisée. À partir du moment où l'un et l'autre sont identifiés, le genre de « l'autre » est indépendant de l'information fournie et la probabilité qu'il soit un garçon est bien 1/2.

Ce problème a été étudié par Fox et Levav[4], qui ont comparé les réponses aux questions suivantes :

  1. Mr. Smith says: "I have two children and at least one of them is a boy." Given this information, what is the probability that the other child is a boy?
  2. Mr. Smith says: "I have two children and it is not the case that they are both girls." Given this information, what is the probability that both children are boys?
  1. M. Smith dit : « J'ai deux enfants et au moins l'un d'entre eux est un garçon. » Étant donnée cette information, quelle est la probabilité que l'autre enfant soit un garçon ?
  2. M. Smith dit : « J'ai deux enfants et il ne s'agit pas de deux filles. » Étant donnée cette information, quelle est la probabilité que les deux enfants soient des garçons ?

L'étude a montré que 85 % des participants donnaient la valeur 1/2 à la première question et seulement 39 % répondaient ainsi à la seconde.

Variantes[modifier | modifier le code]

Les variantes les plus courantes du paradoxe des deux enfants consistent à joindre une autre information au genre.

Prénom[modifier | modifier le code]

Jean-Paul Delahaye propose de déterminer la probabilité que deux enfants soient des filles sachant qu'il y a au moins une fille prénommée Sophie parmi eux[5]. L'hypothèse implicite selon laquelle les deux enfants n'ont pas le même prénom revient alors à particulariser Sophie, ce qui entraîne que la probabilité cherchée vaut 1/2.

Jour de naissance[modifier | modifier le code]

Quelle est la probabilité que deux enfants soient des garçons sachant qu'il y a parmi eux au moins un garçon né un mardi ? Comme dans le problème initial, si ces précisions sont apportées par le parent, la probabilité vaut 1/2. Mais si la précision est posée en question au parent, la probabilité descend à 13/27.

Notes[modifier | modifier le code]

  1. a et b (en) Martin Gardner, The Second Scientific American Book of Mathematical Puzzles and Diversions, Simon & Schuster,‎ 1954 (ISBN 978-0226282534.[à vérifier : ISBN invalide])
  2. Proportion de garçons et de filles selon les âges et les pays
  3. Voir la définition de discerner dans le Wiktionnaire.
  4. Craig R. Fox & Jonathan Levav, « Partition–Edit–Count: Naive Extensional Reasoning in Judgment of Conditional Probability », Journal of Experimental Psychology, vol. 133, no 4,‎ 2004, p. 626–642 (PMID 15584810, DOI 10.1037/0096-3445.133.4.626)
  5. Jean-Paul Delahaye, « Le trésor et les Sophies », Pour la science n° 336, octobre 2005.

Articles connexes[modifier | modifier le code]