Discussion:Loi de Benford

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Discussion récupérée de l'oracle[modifier le code]

<humour gras>Ô Racles moi le fond de la gorge avec ton *** en passant par mon ***</Humour très très très gras> et pendant ce temps là dis moi si tu connais cette théorie qui dit que s'il on prend une suite de nombres ( "utiles", pas généré par un algo pseudo-aléatoire ou tirés au 421, exemple : une page de calcul, les comptes d'une entreprise ou d'un particulier...) et que l'on fait des statistiques sur les chiffres on trouvera plus de 1 que de 2, plus de 2 que de 3, plus de 3 que de 4...jusqu'à neuf. Il parraitrait que les services fiscaux se servent de ça pour trouver les comptes trafiqués ( ou faire peser une lourde présomption). Si j'en avais le courage, je ferais l'essai sur mes comptes.--Lisaël causer 6 septembre 2005 à 22:55 (CEST)[répondre]

Pour une vérif. facile de la loi : vous faite un script pour récupérer la liste des tailles de tout vos fichiers sur le disque dur de votre ordinateur, (sur mon PC : plusieurs centaines de milliers donc c'est qd mm pas mal du point de vue statistique comme série de données). Vous copiez ça dans votre tableur préféré, et hop ça vous sortira la superbe courbe de la loi de bendford. Si vous êtes un geek, vous vous amuserez à étudier la distribution, de la 2ème, ... nième décimale. Enjoy!
Sur mes comptes, ça marche pas : y'a que cinq chiffres d'écrit. :D — Poulpy 6 septembre 2005 à 23:09 (CEST)[répondre]
C'est la Loi de Benford. D'après l'article de la wikipédia francophone elle est utilisée aux Etats Unis. D'après l'article de la wikipédia anglophone, elle pourrait être utilisé dans divers domaines. (Il ne mentionne pas d'utilisation avérée). D'après Ted Hill, dans un article publié dans Scientific American, [...] recent applications include testing of mathematical models, design of computers, and detection of fraud in tax returns. Ce qui se traduit par des applications récentente de la Loi de Benford comprennent le test de modèles mathématique, la conception d'ordinateur et la détection de fraudes aux impôts. --Xavier Combelle 6 septembre 2005 à 23:46 (CEST)[répondre]
On a des preuves tangibles que la loi de Benford est utilisée par l'IRS ? — Poulpy 7 septembre 2005 à 00:02 (CEST)[répondre]

Merci, cette question me tarabustait depuis un certain temps. Pour les non anglophone, on apprend dans l'article suscité ( en un mot, je ne met pas de cochoncetés dans chacun de mes posts tout de même ) on apprend dans l'article cité précédemment, disais-je avant d'être interrompu, que cette loi s'aplique dans le désordre au nombres dans les articles du reader's digest, la liste de la masse atomique des éléments, la liste des populations des 3000 comtés américains, la taille des fleuves, les stats de la ligue de baseball, et ce sans jamais avoir été prouvée ou même expliquée!<envolée lyrique>Quand je pense que certain nient la magie, que dis-je la magie, la mystique du nombre et la poésie des mathématiques après ça!</envolée lyrique> --Lisaël causer 7 septembre 2005 à 00:04 (CEST)[répondre]

Ouais. L'auteur de l'article a pris les données qui convenaient, quoi. :) — Poulpy 7 septembre 2005 à 00:09 (CEST)[répondre]

C'est sûr même :) Je ne voudrais pas casser la magie (si en fait, mais je dois le faire discrètement) -> en:Benford's law. Il y a tout un chapitre "Explanation", "Applications" and "limitations". Pour reciter l'article : Strictly speaking, only a set of numbers chosen at random (from a given probability distribution) is sure to obey the law. Ce n'est qu'une loi probabiliste qui dépend de notre façon de compter, tout bêtement. (Na !) 7 septembre 2005 à 15:15 (CEST) Vlad2i поговорить / أن يتحدّث

Il y a eu une news là-dessus, dans le numéro Juillet-août 2005 de la revue La Recherche, intitulée : Robert Azencott, « La statistique à la rescousse du fisc ». Enro 8 septembre 2005 à 09:07 (CEST)[répondre]


Ce paradoxe est très connu et son origine est remarquable : en consultant un livre de tables de logaritmes (à une époque, pas si éloignée, où l'on n'utilisait pas de calculettes !), un scientifique s'est aperçu que les pages étaient d'autant plus sales qu'elles étaient proches du début du livre. On aurait pu trouver une explication facile pour un roman — on commence à le lire pluis on abandonne plus ou moins rapidement —, mais pas pour des logaritmes, où, a priori, tous les nombres doivent apparaître avec la même probabilité. Le génie du chercheur a été d'en déduire une loi qui est que la probabilité d'apparition d'un chiffre est inversement proportionnelle à son rang. Cette loi est si fréquente que des joueurs de foire l'utilisent pour parier... et gagner, au grand étonnement des badauds. Airelle 8 septembre 2005 à 19:18 (CEST)[répondre]

Hum sans vouloir te vexer, ce n'est (1) pas un paradoxe, (2) les tables de logarithmes sont utilisées principalement pour les chiffres petits, après on compose, ceci expliquant cela (3) l'apparition n'est pas à proprement parler proportionnelle à son rang (4) ce n'était pas d'ailleurs à proprement parler un chercheur (5) ce n'est pas à proprement parler une loi, c'est une remarque empirique qui ne se vérifie qu'en présence de conditions données (non, je ne suis pas un négationniste ! :P) 8 septembre 2005 à 22:05 (CEST) Vlad2i поговорить / أن يتحدّث
Moi pas vexé : j'ai employé le terme de paradoxe dans son acception originelle de « contraire à l'opinion commune » ; bien qu'empirique, on parle bien de la « loi de Benford » ; les entrées des tables de logarithmes sont triées du plus petit nombre vers le plus grand, du moins celles que j'ai eues entre les mains ; il me semble que Newcomb — qui a révélé ce paradoxe, popularisé par la suite par Benford — était bien chercheur, astrophysicien, je crois (en tout cas, il cherchait dans des tables de logarithmes ! ;-) ; en revanche, je n'aurais pas dû écrire « inversement proportionnel » : j'ai rédigé ça de mémoire (Allô, hisse !) et je ne savais plus si c'était hyperbolique, inversement logarithmique, curvilinéaire ou autre. Comme je n'avais pas le temps de chercher dans mes documents ni de faire une régression, je me suis dit que l'idée y serait et que les gens comprendraient plus facilement. Bien que ce ne soit pas un article, je m'en veux de mon laxisme et m'efforcerai de répondre moins vite la prochaine fois ! :o) Airelle 9 septembre 2005 à 18:48 (CEST)[répondre]
"ce n'est pas à proprement parler une loi," ah non? qu'est quoi alors? "c'est une remarque empirique qui ne se vérifie qu'en présence de conditions données ", oui, donc c'est... une loi. Au même titre que les lois de la gravitation, de désintégration radioactive, allométriques (ces dernières inexpliquées jusqu'à récemment et totalement empiriques). Après je peux me tromper, hein, j'ai jamais qu'un bac+5 en sciences - tu me diras, pour ce que ça vaut de nos jours...
"(2) les tables de logarithmes sont utilisées principalement pour les chiffres petits"... désolé de te contredire, mais les tables de log ne sont en fait... plus du tout utilisées! pourquoi pas un régle à calcul pendant qu'on y est!!! (pour ceux qui savent encore ce que c'est). Et oui! c'est ça le progrès... on utilise aujourd'hui des calculateur électronique : les ordinateurs, etc :-)
"ce n'est (1) pas un paradoxe" effectivement, c'est un paradoxe (para-doxa), puisqu'on s'attendrait à ce que la répartition de la première décimale de n'importe quelle série de chiffre soit la même pour tous les chiffres ce qui n'est pas le cas, et va donc à l'encontre du sens commun.
81.243.234.8 16 octobre 2005 à 15:03 (CEST)[répondre]

Une remarque (tardive) : les deux graphiques de 2005 semblent avoir induit des erreurs dans les commentaires. En aucun cas la "loi" de Benford ne concerne les décimales, première ou deuxième. Elle s'applique essentiellement au premier chiffre significatif, donc non nul, quel que soit l'ordre de grandeur de ce nombre. Accessoirement, elle ne s'applique que si plusieurs ordres de grandeur (au moins 3 mais je n'ai pas de source) sont couverts par la série de nombres.Yves Roy (discuter) 20 mars 2018 à 14:12 (CET)[répondre]

Si, si, la loi s'étend au delà du premier chiffre significatif, voir, par exemple, en:Benford's_law#Generalization_to_digits_beyond_the_first. Il serait d'ailleurs bien d'en parler dans notre article. --Epsilon0 (discuter) 20 mars 2018 à 15:44 (CET)[répondre]

Statistiques ?[modifier le code]

Bonsoir Godix. Tu as enlevé cet article de la catégorie Statistiques. Pourtant, cette loi semble née d'une observation statistique, elle est utilisée ainsi et elle est facilement observable par une expérience de cet type (je l'ai fait !). Pourrais-tu argumenter ton choix, s'il te plait ? LyricV (d) 8 janvier 2008 à 20:47 (CET)[répondre]

euh oui en fait il y a une sous catégorie loi de probabilité qui fait partie de la catégorie statistique. Je ferai peut être une sous catégorie loi de probabilité (statistiques) si c'est utile mais je ne le pense pas vu qu'en pratique on se sert d'un peu toutes les lois de proba en stats. En pratique c'est pour essayer de clarifier un peu la catégorie statistique qui n'est pas vraiment exploitable en l'état car elle contient bien trop d'articles donc j'essaye de faire un classement par sous catégories qui seraient un peu moins grosses. godix (d) 8 janvier 2008 à 20:54 (CET)[répondre]
D'accord. Bon courage. LyricV (d) 8 janvier 2008 à 20:59 (CET)[répondre]

Similarité avec la loi de Zipf et la loi de Pareto[modifier le code]

Je ne comprends pas pourquoi il est écrit que la loi de Zipf et la loi de Pareto sont similaires à la loi de Benford. En quoi sont elles similaires ?

--PAC2 (d) 5 septembre 2011 à 16:22 (CEST)[répondre]

✔️ mis dans "Articles connexes", sans commentaire.--Lylvic (d) 5 septembre 2011 à 18:11 (CEST)[répondre]
Ok

Bonjour, Dans les cas où la loi de Newcomb-Benford se vérifie;la répartition des neuf chiffres possibles au premier rang est celle que vous donnez. Mais pourquoi ne pas donner la loi de répartition des dix chiffres possibles de second rang? Je l'ai vu dans une archive de cette article et m'étonne de sa disparition. Il me parait intéressant de s'interroger sur la non indépendance du deuxième chiffre par rapport au premier. https://mistis.inrialpes.fr/software/SMEL/articles/benford/cadre_benford.html Merci de donner suite à ma demande. — Le message qui précède, non signé, a été déposé par l'IP 90.2.60.184 (discuter), le 20 décembre 2015 à 19:25 (CET)[répondre]

Vulgarisation[modifier le code]

J'ai rajouté un "énoncé non formel" pour tenter de remédier à un défaut qui se généralise sur wikipédia qui est de devenir une encyclopédie élitiste, uniquement accessible aux spécialistes. Les lecteurs qui n'ont pas fait d'études supérieures en mathématiques, ce qui représente la majorité de la population, a droit aussi a un accès au savoir et à la compréhension. Alors, le titre que j'ai ajouté est sans doute maladroit ainsi que le texte et je vous encourage à les modifier mais par pitié si vous le supprimer remplacez-le par quelque chose qui soit compréhensible par le commun des mortels ! — Le message qui précède, non signé, a été déposé par Menerlach (discuter), le 20 janvier 2021 à 11:59 (CET)[répondre]

En l'occurrence, c'était très faux. J'ai fait un autre essai en ce sens. Jean-Christophe BENOIST (discuter) 20 janvier 2021 à 12:46 (CET)[répondre]

Proposition d'anecdote pour la page d'accueil[modifier le code]

Une anecdote fondée sur cet article a été proposée ici (une fois acceptée ou refusée, elle est archivée là). N'hésitez pas à apporter votre avis sur sa pertinence ou sa formulation et à ajouter des sources dans l'article.
Les anecdotes sont destinées à la section « Le Saviez-vous ? » de la page d'accueil de Wikipédia. Elles doivent d'abord être proposées sur la page dédiée.
(ceci est un message automatique du bot GhosterBot le 27 novembre 2022 à 18:47, sans bot flag)

Nouvelle image[modifier le code]

je trouve que la nouvelle illustration Logarithmic scale.svg pose plus de problèmes qu'elle n'en résout...

la légende annonce un nombre entre 1 et 100 et l'image commence à 0,1 ; faut il prendre uniquement le nombres affichés ? le 30% est alors faux.. Et si on prend tous les nombres on tombe sur le fait que la probabilité de choisir un réel entre 1 et 100 est nulle... Robert FERREOL (discuter) 3 juillet 2023 à 08:19 (CEST)[répondre]

Bonjour merci pour votre message. C'est entre 0 et 100. Les nombres affichés ? Vous voulez dire les nombres affichés explicitement sur la graduation ? Non, on peut prendre un nombre autre. Ce n'est pas la proba de tomber sur un nombre précis, qui est nulle effectivement, mais la proba de tomber sur un nombre dont l'écriture commence par un 1. Bonne journée. Fschwarzentruber (discuter) 3 juillet 2023 à 14:54 (CEST)[répondre]
Dire "choisir un nombre entre 0 et 100" sous entend en effet prendre la Loi uniforme continue. Le sous-ensemble formé des nombres entre 0 et 1 dont le premier chiffre significatif est égal à 1 a t il une probabilité ? Bonne question , mais cela n'est pas abordé dans l'article qui s'occupe des séries finies ou dénombrables de nombres. Donc je pense qu'il faudrait mettre sur l'image uniquement les nombres de 1 à 100 en mettant en rouge par exemple les nombres de de 1 à 2 exclu et ceux de 10 à 20 exclu qui commencent par 1. La longueur relative en échelle logarithmique de [1,2[ U[10,20] est bien (log 2-log 1)+(log(20)-log(10))/log(100) - log 1) = log 2 == 30%. Cette explication pourrait être donnée.
Bien cordialement. Robert FERREOL (discuter) 3 juillet 2023 à 16:02 (CEST)[répondre]
la réponse à la question entre 0 et 1 doit etre une conséquence du théorème de Diakonis dans Loi de Benford#Loi de Benford continue et uniformité de la partie fractionnaire du logarithme si c'est ce que vous aviez en tête ce peut etre intéressant de le signaler ? Robert FERREOL (discuter) 3 juillet 2023 à 16:23 (CEST)[répondre]
Bonjour, je ne maîtrise pas encore assez le sujet. Je vous laisse faire les modifs sans problème. Je partage votre avis sur le fait qu'il faut plus d'explications. Je suis d'accord avec votre explication.
Merci aussi Ariel Provost. Ce que j'avais écrit au début, c'est-à-dire entre 1 et 100 est correct (et non pas entre 0 et 100). Je suis d'accord que c'est une bonne idée de mettre en rouge (ou pt en bleu, car "rouge" c'est un peu la couleur d'une zone avec une "erreur") les deux intervalles. Mais je ne suis pas l'auteur de l'image. Au moins mettre une explication. Fschwarzentruber (discuter) 3 juillet 2023 à 16:40 (CEST)[répondre]
Voir le résultat sur la page Robert FERREOL (discuter) 4 juillet 2023 à 07:32 (CEST)[répondre]
Merci pour votre réactivité et votre travail sur l'image. Elle est plus simple. J'ai juste une question : je ne comprends pas bien le code couleur. Par exemple pourquoi la couleur de 1 à 2 est la même que celle de 7 à 8 ? Fschwarzentruber (discuter) 4 juillet 2023 à 10:20 (CEST)[répondre]
C'est maple qui a automatisé le choix des couleurs en période 6 apparemment. je n'avais pas remarqué mais l'important n'est il pas d'avoir deux couleurs successives distinctes ? Robert FERREOL (discuter) 4 juillet 2023 à 12:06 (CEST)[répondre]
Oui, c'est pas grave. En tout cas, c'est mieux qu'avant ! Merci pour l'illustration et bonne journée. Fschwarzentruber (discuter) 4 juillet 2023 à 15:43 (CEST)[répondre]