Problème du char d'assaut allemand

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 26 avril 2021 à 23:03 et modifiée en dernier par TigH (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
Lors de la Seconde Guerre mondiale, la production de char d'assaut allemand, tels le Panzerkampfwagen V Panther, a été estimée par les Alliés grâce à des méthodes statistiques.

Le problème du char d'assaut allemand réfère à une estimation de la valeur maximale d'une loi uniforme discrète à partir d'un échantillonnage sans remplacement. Il tire son nom de son application par les Alliés de la Seconde Guerre mondiale afin d'estimer la production de chars d'assaut allemands.

Le problème peut être abordé selon les approches d'inférence fréquentiste (en) ou bayésienne.

Selon l'approche fréquentiste, le nombre total () est fonction du nombre d'échantillons () et de la valeur de l'échantillon le plus élevé () selon la relation suivante :

Hypothèses de départ

On suppose que l'ennemi produit une série de chars immatriculés par des entiers en commençant par le chiffre 1. En plus de cela, quelle que soit la date de production du char, ses années de service, ou encore son numéro de série, la distribution des numéros d'immatriculation est considérée comme étant uniforme dès l'instant où on mène l'analyse.

Exemple

En supposant que k=4, et que les numéros de série relevés sont les suivants : 19, 40, 42 et 60. Le plus grand numéro de série relevé est m=60. On pose N, le nombre inconnu de chars.

La formule d'estimation du nombre total de chars selon l'approche fréquentiste est la suivante :

Tandis qu'en suivant l'approche bayésienne propose cette fonction de masse (probabilités) pour estimer le nombre total de chars :

grâce à laquelle on peut estimer le nombre total chars par la méthode suivante :

La distribution comporte une asymétrie (statistiques) positive puisqu'il y a au moins 60 chars.

Histoire

Panzerkampfwagen V Panther chargés pour le transport sur la ligne de front (1943).

Lors de la Seconde Guerre mondiale, les Alliés ont tenté de déterminer l'étendue de la production allemande d'armement. Pour ce faire, ils ont utilisé deux approches : la collecte d'informations par les services de renseignements et l'utilisation des probabilités et statistiques.

La seconde approche permettait d'estimer le nombre de chars d'assaut allemand à l'aide des numéros de série des chars capturés ou détruits. Ces derniers, recoupés avec les numéros des châssis, moteurs, roues et pneus, ont permis d'établir une séquence de production[1],[2],[3].

Selon les services de renseignements Alliés, la production de chars d'assaut allemand était d'environ 1 400 unités par mois entre et . Selon les estimations statistiques, le chiffre était plutôt de 246 par mois. Après la guerre, les cahiers de production allemands ont été saisis et donnaient une valeur de 245 chars par mois[2].

Estimations de la production allemande[4],[5]
Mois Estimation statistique Estimation par les services de renseignements Selon les archives allemandes
169 1 000 122
244 1 550 271
327 1 550 342

Autres applications

Le problème du char d'assaut allemand a également été utilisé pour l'estimation de la production de fusées V2.

Toujours lors de la Seconde Guerre mondiale, le même modèle a permis d'estimer la production de fusées V2[6].

L'approche a également été utilisée pour l'estimation de production de chars Merkava israéliens[7].

Analyse fréquentiste

L'estimateur sans biais de variance minimale pour une estimation ponctuelle du nombre total de chars est donné par

m est le plus grand numéro de série observé et k est le nombre de chars observé (la taille de l'échantillon). On remarque que, une fois observé, un numéro de série n'a aucune chance d'être à nouveau observé.

Cet estimateur a une variance de

.

En conséquence l'écart-type est approximativement égal a l'écart moyen entre deux observations, c'est-à-dire N / k.

Cette formule d’estimation de N peut être comprise intuitivement comme prenant comme estimation initiale le numéro de série le plus élevé (car étant l'estimateur du maximum de vraisemblance), et en y ajoutant l'écart moyen pour compenser le biais négatif lié à l'utilisation du maximum de l'échantillon m en tant qu'estimateur du maximum de la population totale N. En effet,

.

Notes et références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « German tank problem » (voir la liste des auteurs).
  1. Ruggles et Brodie 1947, p. ?.
  2. a et b (en) Gavyn Davies, « How a statistical formula won the war », The Guardian, .
  3. (en) Robert Matthews, « Data sleuths go to war, sidebar in feature 'Hidden truths' », New Scientist,‎ (lire en ligne [archive du ]).
  4. Ruggles et Brodie 1947, p. 89.
  5. (en) « Order Statistics », sur randomservices.org (consulté le ).
  6. Ruggles et Brodie 1947, p. 90–91.
  7. Johnson 1994.

Bibliographie

Document utilisé pour la rédaction de l’article : document utilisé comme source pour la rédaction de cet article.

  • (en) R. W. Johnson, « Estimating the Size of a Population », Teaching Statistics, vol. 16, no 2,‎ , p. 50–52 (DOI 10.1111/j.1467-9639.1994.tb00688.x.). Ouvrage utilisé pour la rédaction de l'article
  • (en) R. Ruggles et H. Brodie, « An Empirical Approach to Economic Intelligence in World War II », Journal of the American Statistical Association, vol. 42, no 237,‎ , p. 72-91 (DOI 10.1080/01621459.1947.10501915). Ouvrage utilisé pour la rédaction de l'article

Voir aussi

Articles connexes

Liens externes