Discussion:Inférence bayésienne

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Problème de périmètre[modifier le code]

Il y a à mon avis un gros problème de fond sur le périmètre de l'article. L'article a-t-il vocation à présenter l'ensemble de la théorie Bayesienne? les rappels génériques sur la notion de probabilité y ont-ils réellement leur place? Dans le doute et compte tenu du caractère tentaculaire de l'article je vais commencer le nettoyage. Unique Nitrogen (d) 19 mai 2013 à 14:18 (CEST)[répondre]

Je crois qu'il y a encore un peu à faire sur les rapports entre inférence bayésienne et déduction logique, avec dans celle-ci des axiomes, et leurs conséquences dans le système, et dans celles-là, des observations, et des probabilités. Mais faut-il les opposer? La première règle de l'inférence ne serait-elle pas le principe logique du tiers exclu? Une proposition ne peut être que vraie ou fausse, par conséquent . Ce qui me semble appliqué dans bon nombre de démonstrations, et implicite dans la valeur dite évidence. PolBr (d) 19 mai 2013 à 14:37 (CEST)[répondre]
de mon point de vue l'idée ne serait-elle pas plutôt de découper l'article quitte à créer un article "logique bayesienne" ou renforcer les références à l'article "Théorie des probabilités", et de traiter l'inférence pour ce qu'elle est à savoir un ensemble de règles d'inférence.

Unique Nitrogen (d) 19 mai 2013 à 14:44 (CEST)[répondre]

Vous avez raison. Pour ma part, je n'ai pas eu le courage de faire l'inventaire des articles existants, pour voir comment devraient se ventiler les informations nécessaires, et je ne me sens aucune autorité en la matière pour prendre les décisions nécessaires. PolBr (d) 20 mai 2013 à 00:12 (CEST) Après un coup d'oeil sur les pages en anglais et en allemand, je ne puis que confirmer. PolBr (d) 20 mai 2013 à 09:59 (CEST)[répondre]

Je viens d'amplifier le premier exemple cité, du test médical. En quoi est-il bayésien? Le théorème de Bayes se trouve dans tous les manuels, quel que soit leur point de vue. C'est peut-être cette précision qui manque. PolBr (d) 14 juin 2013 à 01:03 (CEST)[répondre]

L'exercice....[modifier le code]

...D'où vient ce biscuit ? sera complété de sa formulation bien plus simple en weight of evidence lorsque je maîtriserai un peu moins mal l'écriture des formules mathématiques :o( François-Dominique 11 sep 2004 à 23:05 (CEST)

Formule Ambiguë pour le non initié[modifier le code]

Dans la formule d'addition : p(A U B | C) peut se lire probabilité de ( A union (B sachant C)) ou alors probabilité de((A union B) sachant C). La première interprétation me semble la plus plausible.


Non A union (B sachant C) ne désigne pas un évènement (ça ne veut même rien dire du tout). Il faut bien comprendre que : P(.|C) avec C évènement de probabilité non nulle est une notation qui désigne une autre mesure de probabilité. Dans ce cas je regarde la probabilité que A ou B se réalise sachant que C est déjà arrivé (on restreint l'espace des possibles à C).--Ernestr (d) 26 mars 2011 à 11:33 (CET)[répondre]


Pourquoi AU(B|C) n'est pas événement (et ne veut rien dire du tout)? A est un événement, B|C est un événement, et l'union de 2 événements en est un si on l'interprète comme un ou. Ceci car on note bien P(A),P(B),P(B|C),P(AUB) indifféremment. Ici on peut très bien lire il me semble la probabilité de A; ou celle de B avec C imposé. De plus si vous parlez d'une autre probabilité pour P(.|C) pourquoi la note-t-on avec P? Nous sommes tous d'accord que P(AUB|C) se lit P((AUB)|C) mais il est clair que pour le non initié cela reste abscons et c'est le point de la question (pas l'erreur d'interprétation). Il en va de même pour la notation P(A,B|C). C'est une remarque de pédagogie.— Le message qui précède, non signé, a été déposé par Sbougnoux (discuter), le 15 juillet 2015 à 18:50 (CEST)[répondre]

La notation est effectivement malheureuse, mais non, n'est pas un évènement. Je vous mets au défi de me le définir rigoureusement. En règle générale, il est largement préférable de noter , de sorte justement à éviter ce genre de problème. Mais écrire est un non-sens. Il est au contraire très bon que le non-initié remarque qu'un tel évènement ne veut rien dire. 138.195.144.117 (discuter) 18 mars 2022 à 22:58 (CET)[répondre]

Neutralite de l'article[modifier le code]

La phrase suivante se trouvant dans l'article inférence bayésienne me parait sujette à discussion par rapport au concept de neutralité :

Là où elle coûte cher à obtenir, ce seront des sociétés privées qui les financeront. Et aucune société privée n'aime donner à ses concurrents des informations qui lui ont coûté cher à obtenir, ce qui est humain.

Cette phrase est à peu près celle qu'emploie Myron Tribus, ancien directeur du développement chez Xerox, professeur émérite de théorie de la décision à l'université de Darmouth et auteur du livre Décisions rationnelles dans l'incertain. Je la modifie cependant afin d'éviter l'ambiguïté signalée. 81.64.199.51 15 jun 2005 à 00:31 (CEST)

a) il n'est pas certain que les recherches chères soient nécessairement le fait du secteur privé. et, au regard des siècles sinon de l'histoire récente, le point de vue inverse peut tout aussi bien être appuyé.

b) le partage du savoir obéit à des règles beaucoup plus complexes que ce que suggère la deuxième phrase citée.

c) enfin, l'appréciation ce qui est humain n'a pas non plus sa place dans une encyclopédie.

d) de toute manière, même si la phrase citée était incontestable (ce qu'elle n'est pas), elle n'a pas grand chose à voir avec un article, par ailleurs fort bien torché, sur l'inférence bayésienne.

Je préfère ne pas amender moi-même l'article pour le moment et laisser à l'auteur originel le temps et le soin de tenir compte (ou non) de mes remarques.

--80.201.81.80 9 jun 2005 à 18:41 (CEST) Marc M., Bruxelles (be)



Traduction de prior[modifier le code]

Bonjour,

Ne serait-il pas mieux de traduire réellement le mot anglais prior, plutôt que de le laisser comme tel. Ça n'aide pas à la compréhension de l'article et c'est un mot relativement inesthétique en français... La traduction la plus utilisée est bien sûr la très mauvaise a priori, mais elle est souvent difficile à utiliser dans une phrase. Pourquoi ne pas utiliser le mot français qui est l'opposé de postérieur, à savoir antérieur (et qui est aussi une traduction de prior tout à fait valable) ? Le mot est certes plus long, mais il est beaucoup plus facile à employer que ce tour de passe-passe entre l'horrible prior et le compliqué a priori.— Le message qui précède, non signé, a été déposé par Scientist Flyos (discuter)

Sur wikipédia, on se conforme à l'usage. Si personne n'utilise antérieur, ce n'est pas à nous d'innover, même si ce n'est pas très joli ou même inexact. Donc ici, on utilisera plutôt a priori... (désolé). Sylenius (d) 7 juillet 2010 à 20:08 (CEST)[répondre]

Je suis d'accord pour "antérieure", mais je n'ai jamais entendu "le prior" comme traduction, et il ne semble pas que ce soit une traduction "d'usage". Peut-être serait-il mieux d'homogénéiser l'article en utilisant toujours "a priori" dans ce cas ? --Flyos (d) 16 juillet 2010 à 15:17 (CEST)[répondre]

Oui, tout à fait ! Il me semble que l'utilisation de « prior » est une mauvaise habitude prise à l'oral, qui peut déteindre sur l'écrit... Sylenius (d) 16 juillet 2010 à 20:14 (CEST)[répondre]

Commentaires sur l'article[modifier le code]

Je pense que l'affirmation suivante est fausse : L'inférence bayésienne ne permet jamais d'atteindre la certitude, mais de remettre à jour en permanence le degré de plausibilité de chaque élément considéré.

Heu ? Quand on affirme qu'une négative est fausse, n'est-il pas plus clair d'indiquer à la place la positive que l'on trouve vraie ? 81.65.27.14 31 août 2005 à 10:52 (CEST)[répondre]

Je peux très bien imaginer une situation où on a deux hypothèses, et l'une se révèle impossible à réaliser en vertu des données mesurées. Dans ce cas, il est possible d'atteindre la certitude sur la véracité de l'hypothèse concurrente.


Au sujet de la différence entre les statistiques classiques et les stats bayésiennes, j'ajouterais, mais on peut en discuter avant, que le concept de test statistique de fonction de vraisemblance sont mal définis. Le test statistique se base sur la probabilités d'événements non-mesurés, ce qui est absurde puisque cela suppose de l'information qu'on a pas. La fonction de vraisemblance, de son côté, fait l'hypothèse implicite que tous les paramètres sont équiprobables, ce qui dans plusieurs situations peut se révéler faux. Pour le reste, je suis assez d'accord avec l'idée que l'analyse bayésienne nécessite des efforts supplémentaires qui peuvent être superflus pour les problèmes standards, ceux pour lesquels les incohérences des stats classiques ont peu d'influence. L'avantage majeur réside, à mon avis, dans la capacité de traiter des problèmes complexes de manière formelle : on pose le problème et on applique les règles, sans avoir recours à des tours de passe-passe.

Il n'existe pas d'hypothèse d'équiprobabilité en méthodes bayésiennes. Il y a choix parmi toutes les distributions a priori respectant les contraintes de celle, toujours unique, qui est d'entropie maximale et contient donc le moins d'"information (parasite) ajoutée 81.65.27.14 31 août 2005 à 10:54 (CEST)[répondre]

Côté présentation, je garderais la partie sur l'évidence et la notation en dB pour une section ultérieure, car c'est accessoire. Les concept importants me semble être plutôt les règles formelles de la théorie des probabilités : loi d'addition et de multiplication.

Enfin bref, faites moi savoir si des modifications en ce sens vous semble raisonnables.

Cordialement,

Huard

Ce changement ne serait pas à mon avis une bonne idée. L'intérêt de la notation de Good est que la relation de Bayes y devient additive et indépendante des priors, ce qui est impossible avec la notation sur [0,1]. En fait, tous les systèmes bayésiens que je connais travaillent en décibels, ce qui leur permet sans sacrifier un iota de précicion de les rendre 1) rapides 2) faciles à coder et maintenir 3) très faciles à surveiller pendant qu'ils sont dans des phases de convergence (apprentissage) dans le cas de réseaux bayésiens. En fiabilité, où on est obligé utiliser aussi beaucoup les mathodes bayésiennes, il n'est d'ailleurs guère possible de travailler lisiblement avec autre chose que des décibels. 81.65.27.14 31 août 2005 à 10:52 (CEST)[répondre]
Le Collège de France, en 2011, les nomme décibans : https://www.google.fr/webhp?sourceid=chrome-instant&rlz=1C1SKPM_enFR438FR438&ion=1&ie=UTF-8#q=d%C3%A9cibans&nfpr=1&ei=Hs-NUeSILoa6hAfr24DIDA&sqi=2&start=0&ion=1&bav=on.2,or.r_cp.r_qf.&bvm=bv.46340616,d.Yms&fp=fcf0a413bd56d62a&biw=768&bih=425
Cela semble un néologisme, mais cette institution semble avoir toute légitimité pour en créer en attendant que l'Académie avalise ou non. 212.198.148.24 (d) 11 mai 2013 à 06:59 (CEST)[répondre]
Je travaille sur l'article décibel et j'aimerais bien avoir des références pour son emploi en inférences bayesienne.
Trois références sont données dans l'article. Il suffit de lire. J'ai du mal à comprendre le sens de cette intervention, de même que l'intervention de personnes dont l'expérience semble concerner l'acoustique pour "corriger" (?) un article de probabilités. Aucune science n'est propriétaire du langage, sinon les pauvres mathématiciens auraient des difficultés avec leur terminologie de groupe, corps, anneau, base, filtre, noyau et adhérence. 212.198.148.24 (d) 15 mai 2013 à 00:53 (CEST)[répondre]
Je remarque:
1. que le Ban (avec son sous-multiple déciban) a un article de définition en anglais ;
2. que l'abréviation entre les deux ne diffère que par la casse, puisque le B prend une majuscule seulement quand il rend hommage à un nom propre (Bell), donc en principe dB se lit décibel et db se lit déciban : c'est une différence assez petite pour permettre la confusion ;
Il n'y a pas de confusion, puisque les deux termes désignent la même chose, exactement comme un volt par mètre et un newton par coulomb.

3. que le décibel s'applique en principe à des rapports de puissance,
Le propre d'une formule mathématique est de s'appliquer à ce qu'on veut. C'est bien ce qui fait la puissance et l'universalité des mathématiques. D'ailleurs on parle bien de moment d'inertie pour exprimer la solidité des poutres en I, bien que l'inertie ne soit pas directement concernée, simplement parce que la formule est la même. et cela depuis plus d'un siècle.
tandis que le déciban traite de quantité d'information ;
4. que ce n'est pas à l'Académie française de statuer sur l'usage d'une unité, mais à l'ISO
Pour la langue française ? Je doute que ce soit l'ISO qui ait imposé aux étudiants en physique de la fin des années 60 de prononcer neuton pour newton (l'unité). Plutôt quelque obscur comité de vocabulaire comme celui qui prétendit imposer quelque temps quincaille et mentaille pour hardware et software
ou à des instances de coordination scientifique.

En ce qui concerne l'affirmation de 81.65.27.14 ci dessus « sans sacrifier un iota de précicion (sic) », elle est pour le moins contestable. Quand on veut de la précision, on évite de passer par les logarithmes
C'est une plaisanterie, ou bien confondez-vous les bidouillages du calcul numérique pratique avec les formules de la mathématique (oh la ! Quand je me mets à vouvoyer ici, ce n'est pas bon signe).
aller et retour. Tous les calculs finissent par un arrondi qui sacrifie un peu de précision.
J'avais apparemment vu juste.
On utilise le log pour être expressif (ça évite de compter les zéros, mais si ce n'était que ça on pourrait utiliser une notation type 2.5e-2)
Une expressivité au dépens de la lisibilité ? Intéressant. Et donc, si je comprends bien, nous avons ici un acousticien (ou un électronicien) qui entend régenter tout à coup quarante ans d'usage des bayésiens ? Sérieux ?
ou pour faire des additions au lieu de multiplications quand la précision est sans objet
L'intérêt des évidences est de ne pas obliger à effectuer constamment des renormalisation sur ]O,1[ qui n'apportent rien à la lisibilité des calculs.
(ce qui me semble être le cas pour les poids de conviction bayesiennes).

On se trouve dans un cas où on a besoin de sources à l'appui des assertions. PolBr (d) 11 mai 2013 à 11:28 (CEST)[répondre]
3 soursces sont données, dont une sur un cycle complet de conférences assuré par le titulaire d'une chaire au Collège de France. Maintenant, en effet, cela peut-il avoir la moindre valeur face aux habitudes professionnelles d'un acousticien ou d'un électronicien ? Je ne sais.
Voici des liens sur le livre de Tribus, et si l'un d'entre eux concerne Google Books, les décibels seront au rendez-vous.
https://www.google.fr/search?client=ubuntu&channel=fs&q=rational+descriptions%2C+decisions+and+designn&ie=utf-8&oe=utf-8&redir_esc=&ei=Ub-SUeeiEvOg0wWz8IA4
212.198.148.24 (d) 15 mai 2013 à 00:53 (CEST)[répondre]
Eh bien voilà. Ils y sont :
http://books.google.fr/books?hl=fr&id=fW1bAAAAMAAJ&q=decibels#search_anchor
Je vous laisse le soin de réparer vos dégâts en remettant dans l'article ce que vous en avez un peu hâtivement ôté. Est-ce que je viens me mêler de mettre mon grain de sel sur l'acoustique ou les rapports signal-bruit, moi ? ;-)
212.198.148.24 (d) 15 mai 2013 à 00:58 (CEST)[répondre]

Réponse inutile de monter sur vos grands chevaux, de hacher la discussion en coupant l'intervention à laquelle vous répondez, et de couvrir l'interlocuteur de votre mépris.
1. Je vous crois compétent dans votre domaine, c'est pour ça que je vous demande une référence à l'appui de l'usage de décibel (ouvrage et page en note dans le texte).
2. On demande des références pour une affirmation non triviale. En quoi l'assertion sur les décibels est-elle non triviale? C'est que le décibel est défini rigoureusement comme rapport de deux puissances.
3. Vous dites que ça s'appelle pareil parce que ça se calcule pareil. 10*log(Pb/Pa) n'est pas 10*log(P/(1-P)).
4. Je n'ai rien enlevé de l'article. J'ai ajouté des demandes de références, expliquées ici, et un bandeau ébauche, au vu de l'état rédactionnel et d'organisation de l'article. Relisez-le. Il ne s'agit pas ici de compétences en mathématiques, mais en rédaction.
5. La référence que vous indiquez documente l'usage du terme décibel à la date de publication.
6. Quant au judicieux de cet usage, il me semble discutable. PolBr (d) 15 mai 2013 à 09:02 (CEST)[répondre]

  • je vous crois compétent dans votre domaine, c'est pour ça que je vous demande une référence à l'appui de l'usage de décibel (ouvrage et page en note dans le texte)
Et c'est pour cela que je l'ai donnée. Je comprends en revanche moins pourquoi elle a été supprimée ou déplacée de l'endroit même où elle avait été réclamée (voir historique).
Le moment d'inertie est défini en physique au lycée comme une caractéristique inertielle, puis ce nom réutilisé dans un contexte statique en résistance des matériaux parce qu'l n'était nul besoin de donner deux noms différents à ce qui était calculé par exactement la même formule. Principe d'économie. Nous parlons bien d'une feuille de papier et du pied d'un arbre alors que les feuilles sont au départ ce qui pousse sur les arbres et que ceux-ci ne possèdent pas de pieds. Toute définition, comme toute fonction mathématique ou toute marque déposée, possède un domaine de validité en dehors duquel l'usage du terme peut être recyclé. Tous les mots français sont à ma connaissance polysémiques.
  • hacher la discussion en coupant l'intervention à laquelle vous répondez
Quand on repond pas à une question là où elle est posée, on est obligé d'en répéter le texte plus loin (comme je le fais ici). Cela favorise-t-il la lisibilité ? La chose se discute.
  • J'ai ajouté des demandes de références, expliquées ici
... et qui y sont heureusement toujours. Est-ce que je me trompe ou est-ce que les références données pour faire suite à cette demande ont été supprimées ?
  • La référence que vous indiquez documente l'usage du terme décibel à la date de publication
Dès la date de multiplication, 1969. On retrouve la même terminologie dans la traduction de Jacques Pézier, 1973, utilisé à cette date dans les écoles d'ingénieurs. Puis chez Jaynes[1]. Puis chez Robert (Le Choix bayésien) tant dans sa version originale française (2006) que dans sa traduction anglaise. "Déciban", apparu donc très tardivement, pourrait constituer un meilleur choix, mais il reste à voir si la communauté bayésienne francophone le souhaitera après environ 40 ans d'usage éprouvé d'un autre terme. Ce n'est en tout cas pas à nous de prendre position sur la Wik, bien qu'il soit logique de mentionner les deux termes, les noms de leurs utilisateurs et les dates correspondantes.
Enfin, je me rends compte qu'avec le système consistant à reporter toutes ses réponses plus bas, les propos auxquels ont répond deviennent tout aussi hachés qu'en répondant in situ. Comme quoi rien n'est simple :-/ 212.198.148.24 (d) 17 mai 2013 à 18:39 (CEST)[répondre]

Vous demandez qui a défini le décibel, vous trouverez la réponse dans la partie historique de Décibel ; et qui le définit aujourd'hui, eh bien, c'est une unité associée au système ISO même si elle n'en fait pas partie, décrite dans les documents de cette organisation, ainsi que dans ceux de la Commission électrotechnique internationale; voyez l'article.<br /> Une partie de l'argumentation sur son usage ici vaut pour tout logarithme. En sensitométrie/optique quantitative, on cote, pour les mêmes raisons, la densité optique/transmittance en log (décimal), et les gens n'ont pas ressenti le besoin d'emprunter un unité issue des télécommunications. C'est la rançon du succès du mot décibel, mais l'inconvénient, c'est que les conotations et approximations populaires sont importées dans votre champ. Je suis donc bien d'accord avec vos conclusions en ce qui concerne le décibel, et j'ai reporté dans l'article Décibel la référence à Tribus 1969.<br />Reste que cet article souffre de faiblesses rédactionnelles, ce qui est bien dommage vu l'intérêt du sujet. PolBr (d) 17 mai 2013 à 19:55 (CEST)[répondre]

Le caramel a été défini en premier dans les manuels de cuisine, de confiserie et de pâtisserie. Cela n'a pas empêché l'industrie nucléaire de lui donner un sens très différent dans son propre domaine. Aucune discipline n'a de mandat particulier pour régenter le vocabulaire utilisé par les autres, même si voir midi à sa porte est un défaut si classique qu'on lui a donné un nom : déformation professionnelle. 212.198.148.24 (d) 17 mai 2013 à 22:53 (CEST)[répondre]

Encore un mot sur décibel: l'argument de son usage dans les quarante dernières années n'est pas totalement suffisant. Bien sûr WP doit rendre compte des usages. Mais pendant des années après qu'on[réf. souhaitée] eût décidé d'utiliser le newton et le watt, les ingénieurs ainsi formés ont continué à s'exprimer en kilogramme-force et en chevaux-vapeur. Les dictionnaires encyclopédiques publiés dans l'intervalle de transition ne devaient-ils pas privilégier l'usage le plus rationnel? PolBr (d) 17 mai 2013 à 20:07 (CEST)[répondre]

Il y aurait intervalle de transition si quelque instance de normalisation du vocabulaire s'était prononcée sur le terme déciban avant que la profession n'utilise largement - et pendant quarante ans - décibel. Cela n'a pas été le cas, ce qui rend la comparaison hasardeuse. Cela étant, si "les chiffrent parlent", est-il spécialement irrationnel ou choquant à ce que ceux qui parlent plus fort que les autres soient crédités d'un plus grand nombre de décibels ? Ce recoupement montre au contraire l'excellente cohérence de la terminologie. 212.198.148.24 (d) 17 mai 2013 à 22:53 (CEST)[répondre]

Je ne me garde de "régenter" quoi que ce soit. L'usage des métonymies est un recours fondamental de la rhétorique. Votre phrase ci-dessus « ... ceux qui parlent plus fort que les autres soient crédités d'un plus grand nombre de décibels » témoigne de ce que cet art ne vous est pas étranger, sinon en théorie, du moins en pratique. Je dirais même que vous y éprouvez un certain plaisir, ce dont je vous félicite.
Quel est votre objectif final dans cette discussion?
D'après ce que je lis ici, le raisonnement bayésien a eu du mal à s'imposer. Le recours à des artifices de présentation (comme l'usage du décibel dans un sens, disons, élargi) était utile et nécessaire. Avec une meilleure acceptation, il est peut-être possible de s'exprimer avec plus de précision, d'autant que pendant ces quarante ans, le mot décibel est aussi devenu plus connu, et connaît un usage public peu rigoureux, qui pourrait être embarassant pour votre propre spécialité, en raison de son lien avec les nuisances sonores, par exemple, ou bien du raccourci fait depuis l'existence des gros systèmes de sonorisation entre parler fort et parler bien. Je soumets ces réflexions à votre sagacité, et ne m'inquiète que de la rédaction des articles cités dans Décibel (homonymie) (et, depuis que je l'ai lu, de cet article aussi).
Amicalement. PolBr (d) 18 mai 2013 à 11:18 (CEST)[répondre]

Lien externe mort[modifier le code]

Bonjour,

Pendant plusieurs vérifications automatiques, un lien était indisponible. Merci de vérifier si il est bien indisponible et de le remplacer par une version archivée par Internet Archive si c'est le cas. Vous pouvez avoir plus d'informations sur la manière de faire ceci ici. Les erreurs rapportées sont :

Eskimbot 31 janvier 2006 à 05:03 (CET)[répondre]

Pb ac l'exemple de la femme enceinte[modifier le code]

Bonjour!

L'exemple commence par:

on cherche la probabilité 

Puis donne la formule bien connue

 

Simplement que dire de cette affirmation:

Remarquez que l'inversion de la probabilité introduit le terme , la probabilité a priori d'être enceinte, souvent appelé le prior. Le prior décrit la probabilité de l'hypothèse, indépendamment du résultat du test. Une femme qui utilise des moyens de contraception choisirait un très faible, puisqu'elle n'a pas de raison de croire qu'elle est enceinte. Par contre, une femme ayant eue récemment des relations sexuelles non-protégées et souffrant de vomissements fréquents adopterait un prior plus élevé. Le résultat du test est donc pesé, ou nuancé, par cette estimation indépendante de la probabilité d'être enceinte.

Ne cherche-t'on pas plutot a calculer et non a l'estimer? N'est-ce pas qui est le prior? Merci de vos reponses.. Toots5446 19 septembre 2006 à 14:07 (CEST)[répondre]


Bonjour, L'énoncé du problème étant le suivant : Prenons l'exemple d'une femme cherchant à savoir si elle est enceinte. (...) Le calcul de cette probabilité passe évidemment par l'analyse du test de grossesse.
L'information supplémentaire attendue par notre analyse semble bien être  ; de même l'explication portant sur la détermination a priori de semble convenable.
Par contre, peut-être quelques informations supplémentaires sur la détermination de seraient utiles. Il me semble qu'on fait souvent appel dans ce cas aux probabilités totales ; mais que dire de dans le cas général ? (non appliqué à notre cas particulier où cette estimation peut avoir un sens).
Pour le reste, article prometteur, déjà très intéressant, merci.

Passage incomprehensible, ou a documenter[modifier le code]

Bonjour encore! Je ne suis pas un novice en math, mais je pense qu'a certain passage l'article semble redige par et pour les deja-convertis au domaine. Ainsi certaines references, ou certaines tournures de phrases semblent completement obcure pour quiconque se plonge pour la premiere fois sur le sujet, surtout dans les differences entre statistique classique et Bayesienne.. On a souvent l'impression d'entendre un discour de gens de l'ecole Bayesienne s'expliquant entre eux ces problemes (je suis dans la recherche, je connais ca sur d'autre sujets..)

Exemple:

Le psi-test bayésien (qui est utilisé pour déterminer la plausibilité d'une distribution par rapport à des observations) est asymptotiquement convergent avec le χ² des statistiques classiques à mesure que le nombre d'observations devient grand. Le choix apparemment arbitraire d'une distance euclidienne dans le χ² est ainsi parfaitement justifié a posteriori par le raisonnement bayésien.

Affirmation completement vide pour un neophyte: en quoi la convergence avec le x2 est elle uncritere pertinent? De plus, surtout, le choix d'une distance euclidienne n'est explique nul part et on ne sait pas a quoi il se rapporte..

Aussi, dans la section Annexe historique , on est tout a fait dans le pb: ces rappels sont parfaits pour quelqu'un maitrisant deja le sujet, mais il sort du cadre encyclopedique general (le neophyte).. Ainsi, les propositions 3 et 4 sont completement incomprehensibles sans references:

3 Les probabilités a priori sont souvent dans d'autres méthodes utilisées inconsciemment (critère de Wald, critère du minimax...)

Expliquer les methodes

4 Comme pour tout autre modèle, les effets de différents choix a priori peuvent être considérés de front.

de front...?

En dehors de cela, l'article est plutot bon, merci de votre travail! Toots5446 19 septembre 2006 à 14:20 (CEST)[répondre]

Bonjour, vous parlez du psi-test bayésien. Je travail avec du bayésien depuis plusieurs années et je n'ai jamais croisé ce terme; Pouvez vous donner plus d'information? En fait j'aimerai bien savoir ce qu'est un test en bayésien. En fréquenciste je connais, mais en bayésien ???? Dangauthier 27 février 2007 à 15:03 (CET)[répondre]

Comme pour le chi2, le psi-test mesure la distance entre deux distributions, par exemple une théorique et une observée. Dans le Chi2, cette distance est calculée comme une somme de carrés des différences, et s'apparente donc au carré d'une distance dans un espace euclidien, mais à ma connaissance (du moins au simple niveau d'une école d'ingénieurs généraliste, il se peut que l'ENSAE aille plus loin) rien n'est fait pour justifier ce choix très particulier, alors que quantité d'autres exemples de distances existent en mathématiques (où ce qui est demandé à une "distance" est essentiellement de vérifier l'inégalité triangulaire). Dans le psi-test, c'est une distance qui est liée à l'entropie résiduelle, et qui est une somme d'éléments en 1/Ni ln 1/Ni. Au mesure que N devient grand, 1/Ni devient petit et son logarithme se comporte comme la valeur elle-même, et 1/Ni ln 1/Ni se comporte comme (1/N)2.

Sinon, vous dites que les 2 approches sont complémentaires. C'est une affirmation très forte. Je trouve pour ma part qu'elles sont théoriquement, philosophiquement et dans les calculs assez en contradiction. En fait le débat fréquenciste/bayésien n'est pas clos et la communauté est très divisée. Je pense donc que l'article devrait prendre du recul sur ce problème avec des phrases du type : certaines pensent que... il est souvent rapporté que.... Dangauthier 27 février 2007 à 15:03 (CET)[répondre]

Cette division n'existe plus aujourd'hui, 2013, la convergence des calculs ayant réconcilié tout le monde et supprimé une bisbille sans fondement réel. La controverse, amorcée vers 1969, a en effet battu son plein vers 1974, mais je n'ai pas connaissance qu'il ait existé du monde pour s'y intéresser encore en 2007. 212.198.148.24 (d) 11 mai 2013 à 07:50 (CEST)[répondre]

PS: pour ma part je suis 100% bayésien, mais il est clair que nous somme une minorité en comparaison du nombre astronomique de gens qui utilisent les test d'hypothèse classiques (souvent sans les comprendre, hélas). Qu'en pensez vous ? (et merci pour votre travail) Dangauthier 27 février 2007 à 15:03 (CET)[répondre]

Le psi-test est décrit dans l'ouvrage de Myron Tribus "Rational Descriptions, Decisions and designs", traduit en français par le centralien Jacques Pézier (chez Dunod, je crois) sous le titre Décisions rationnelles dans l'incertain. Il est épuisé et ne sera probablement pas réédité, puisque tous ses exemples sont en BASIC de Dartmouth, mais un exemplaire existe à la bibliothèque du centre Pompidou (livre jaune et gris).
Des expressions comme certains pensent que et il est souvent rapporté que sont par ailleurs à éviter dans la Wikipédia car elles représentent du Wikipédia:Contenu évasif :-) 212.198.140.221 (d) 11 août 2010 à 06:53 (CEST)[répondre]
Le raz-de marée bayésien semble aujourd'hui (2013) avoir imprégné toutes les sciences, au point de faire la "une" d'un magazine grand public comme Sciences et Vie en 2012. Et il n'y a pas plus d'opposition aujourd'hui entre les méthodes bayésiennes et les statistiques qu'entre le modèle d'Einstein qui sert à calculer sans erreur les positions des satellites GPS et celui de Newton qui suffit largement pour les lancer. À chaque domaine son outil, et à chaque précision son modèle. Il n'y a plus d'"ennemi" parce qu'il n'y a plus de guerre : juste des moyens différents adaptés à des problèmes différents. Et là où on pouvait utiliser indifféremment les deux méthodes, elles ont donné jusqu'à ce jour les mêmes résultats  :-)212.198.148.24 (d) 11 mai 2013 à 07:41 (CEST)[répondre]

d'où vient ce biscuit ?[modifier le code]

Je tombe sur cet article par hasard. J'en ai modérément apprécié la teneur, pour dire vrai.

Par exemple, dans le problème du biscuit, je ne vois absolument pas ce que l'approche bayésienne apporte, mis à part une complexité inutile, par rapport à une approche "classique". Je peux dire ceci librement car je ne "penche" ni pour une école ni pour une autre du fait que je n'utilise essentiellement pas de statistiques. Ce n'est pas le cas de mon filtre anti-spam !

La résolution d'un énoncé aussi simple est pourtant à la portée de n'importe quel élève de seconde appliquant bêtement son cours. Nous avons quatre sortes de biscuits :

 a) au chocolat provenant de A, il y a en 30
 b) nature      provenant de A, il y a en 10
 c) au chocolat provenant de B, il y a en 20
 d) nature      provenant de B, il y a en 20

Probabilité qu'un biscuit au chocolat tiré au hasard vienne de A = nombre de cas favorables / nombre de cas possibles = (a) / (a + c) = 30 / 50 = 0,6

Probabilité qu'un biscuit au chocolat tiré au hasard vienne de B = nombre de cas favorables / nombre de cas possibles = (c) / (a + c) = 20 / 50 = 0,4

Cet exemple n'est donc vraiment pas probant pour illustrer la spécificité de l'approche bayésienne.

Bon courage et en tout cas merci de vos effort à tou[te]s. 90.50.14.181 (d) 14 juin 2009 à 01:16 (CEST)[répondre]

Ce n'est pas faux. Quand j'aurai un moment, je le remplacerai par un problème non soluble par les statistiques classiques : estimation du nombre de voitures immatriculées à partir de l'observation d'un certain nombre d'immatriculations. Celui-ci est spécifiquement inférentiel. 212.198.140.221 (d) 11 août 2010 à 07:01 (CEST)[répondre]

Méthodes "standards"[modifier le code]

Cela paraît étonnant, mais le Larousse des difficultés de la langue française affirme que l'adjectif standard, qui ne s'accorde pas en genre, s'accorde cependant en nombre ("des configurations standards"). J'ai donc modifié l'article pour qu'il observe cette règle. 212.198.22.234 (d) 13 juillet 2011 à 00:03 (CEST)[répondre]

Question de définition[modifier le code]

Actuellement, nous avons « Dans le raisonnement bayésien, on attribue à toute proposition une valeur entre 0 (faux à coup sûr) et 1 (vrai à coup sûr), ou la distribution de probabilité de cette valeur. » Dans cette phrase, la seconde partie de l'alternative me semble tout-à-fait obscure pour le néophyte de bonne volonté. [ [ Distribution de probabilité ] ] renvoie vers Loi de probabilité, qui nous dit « Une loi de probabilité décrit de manière théorique [...] un processus réel de nature expérimentale, où le hasard intervient, avec des issues possibles bien identifiées. » D'après la phrase de la définition du présent article,

  1. une proposition peut être vraie ou fausse (deux « issues possibles bien identifiées », 1 bit d'information), mais on ne sait pas lequel, il y a une probabilité p qu'elle soit vraie, (1-p) qu'elle soit fausse ;
  2. pour qu'on puisse attribuer à une proposition une distribution de probabilité, il faudrait qu'elle ait plus de deux issues possibles. Il me semble que c'est contradictoire avec la définition d'une proposition. Il doit s'agir d'un évènement plutôt qu'une proposition.
  3. je soumettrais donc aux spécialistes, à fins de correction, la rédaction suivante: « Dans le raisonnement bayésien, on attribue à toute proposition une valeur entre 0 (faux à coup sûr) et 1 (vrai à coup sûr), ou, pour un évènement pouvant avoir plus de deux issues possibles, la distribution de probabilité de ces issues. »

PolBr (d) 31 mai 2013 à 14:17 (CEST)[répondre]

Notes et références de la discussion[modifier le code]

  1. Jaynes argues for using 10*log_10() instead of natural logarithm - and calling this function "evidence" Evidence is thus measured in decibels (abbreviated as "db") Using evidence is more easy for a human to understand than other base logarithms 1 db is about how much change is perceptible for a human 0 db ~ 1:1 3 db ~ 2:1 6 db ~ 4:1 10 db ~ 10:1 20 db ~ 100:1 30 db ~ 1000:1

Symboles de multiplication dans la formule de multiplication[modifier le code]

Bonjour, Est-ce que c'est intentionnel de ne pas utiliser le point (surélevé) de multiplication (\cdot) dans la formule suivante ?

La règle de multiplication

Voici ce que ça donne avec le point de multiplication :

Je me demande pourquoi l'opérateur P est noté comme une variable en italique, et les évènements A et B en romaine comme des opérateurs. Dans mon manuel, tout est en romaines. Si quelqu'un pouvait indiquer une autorité pour les notations à utiliser dans wp... Également, toutes ces formules peuvent s'écrire plus économiquement sans <math>...</math> avec les unicodes appropriés, qui, dans le cas présent, sont tous disponibles sous la fenêtre de modification (option « Math ») : P(A∩B)=P(A|B).P(B)
PolBr (discuter) 2 novembre 2013 à 10:11 (CET)[répondre]

Les immatriculations du moment[modifier le code]

J'ai corrigé la formule K = Smax × (N-1)/(N-2) en K = Smax × (N+1)/ N - 1. Il y aurait besoin d'une source. Thémistocle (discuter) 23 novembre 2013 à 12:45 (CET)[répondre]

Ça serait aussi bien d'indiquer la démonstration, plutôt que de le laisser comme exercice au lecteur PolBr (discuter) 23 novembre 2013 à 13:01 (CET)[répondre]
Disons que j'ai démontré cela sur mon cahier, mais d'une part j'ai la flemme de tout écrire sur Wikipedia, surtout s'il faut utiliser les symboles mathématiques, et d'autre part je crains que ce ne soit considéré comme un abominable TI puisque je n'ai pas de source et que j'ai fait ma démonstration moi-même.Thémistocle (discuter) 23 novembre 2013 à 13:17 (CET)[répondre]
Comme rien n'est sourcé exactement dans l'abondante bibliographie de l'article, un « abominable TI » de ce genre ne nous changerait pas. PolBr (discuter) 23 novembre 2013 à 17:16 (CET)[répondre]

Ooops si la formule

est bien ce que vous voulez (préséance des opérations), merci de le remettre dans l'article... PolBr (discuter) 23 novembre 2013 à 17:25 (CET) ... sinon la précédente en code math était[répondre]

PolBr (discuter) 23 novembre 2013 à 17:30 (CET) En outre, ça demande des explications supplémentaires, comme par exemple l'hypothèse qui n'est pas forcément réalisée dans la vraie vie que tous les numéros ont une chance égale d'être aperçus (pas d'aire géographique, les numéros ne correspondant plus à des véhicules en circulation sont réattribués). PolBr (discuter) 23 novembre 2013 à 17:36 (CET)[répondre]

Si j'ai finalement supprimé ma formule, c'est que l'on m'a fait remarquer, par un argument simple et puissant, qu'elle avait toutes les chances d'être fausse. Je reprendrai mes calculs demain, plus pour moi que pour l'article : on ne peut prendre le risque de faire figurer une formule fausse sur cette page qui induirait en erreur le lecteur. Une recherche sur internet n'a rien donné (on ne présente que le cas continu, et non le cas discret).Thémistocle (discuter) 23 novembre 2013 à 18:42 (CET)[répondre]

Bonjour, je reviens sur cette question, la formule présentée ici est bien sûr complètement fausse. Si vous voyez trois plaques d'immatriculation 10000, 20000, 30000, on peut supposer qu'en moyenne il y a 40000 plaques. Avec la formule, cela donnerait 60000. C'est un non sens. Quand le nombre de plaques est grand, on se rapproche d'un tirage sans remise et continu, et on sait tous que si je prends N valeurs tirées unformément sur un intervalle [0, lambda], l'estimateur sans biais de lambda est lambda *(n+1)/n. Un simple test sur Excel (je tire trois valeurs au hasard entre 0 et 100000, je prends le max, et je multiplie par 2) donne si l'on fait beaucoup de fois l'expérience en moyenne 150 000 (et non 100 000). Thémistocle (discuter) 21 juillet 2016 à 22:50 (CEST)[répondre]

Il serait profitable à votre argumentation qu'elle respecte l'énoncé de l'article qui indique « Pour n supérieur à 3, (...) ». Selon l'article, si vous voyez 4 plaques, parmi lesquelles la plus haute valeur est 30000, l'estimation est 30000×(4-1)/(4-2), soit 45000. Selon la formule que vous proposiez, elle est 30000×(4+1)/4-1 soit 37499. Bien entendu, les estimations convergent quand le nombre d'observations croît.
Il me semble que le problème est identique à Problème du char d'assaut allemand. Selon cet article, l'estimation est de Smax-1+Smax/n, ce qui est votre formule, dans un ordre différent. Elle n'est pas dite bayesienne, et l'article en anglais donne un bon paquet d'explications. La formule fréquentiste suppose que le numéro enregistré sort de l'effectif, ce qui n'a pas de raison d'être dans le problème de l'article. Il n'y a pas trace de cette condition dans l'établissement de la formule bayesienne, développée en détail matheux.
Cordialement, PolBr (discuter) 22 juillet 2016 à 00:14 (CEST)[répondre]
Bonjour, est-ce à dire que le "n supérieur à 3" est en fait un "strictement supérieur"? Désolé, je ne pouvais pas deviner qu'en plus d'une formule fausse, les conditions énoncées étaient imprécises. Cela ne change strictement rien à l'affaire d'ailleurs. Si je vois 4 plaques, à 10000, 20000, 30000, 40000, je vais en déduire logiquement qu'en moyenne il y en a 50O00 tandis que la formule donne 40000*(5-1)/(5-2)=53333, ce qui est trop élevé. Par ailleurs, on voit clairement que les deux articles ne collent pas. Pour l'un, asymptotiquement, on est à : m+m/k=m*(k+1)/k tandis qu'ici on est à m*(k-1)/(k-2), i.e. d'un côté il faut augmenter m d'un k ième tandis que de l'autre il faut augmenter m d'un (k-2) ième. Cela me renforce dans mon idée que la formule présente ici est fausse. Après, quand on ne cherche pas la convergence quand le nombre de plaques augmente, il faut travailler en discret et se demander si l'on est en tirage sans remise ou avec remise, ce qui complique la formule. Mais ici, on a une formule fausse. Thémistocle (discuter) 22 juillet 2016 à 18:35 (CEST)[répondre]
Je lis cet article avec soin, mais sans grandes connaissances préalables. Quand un article plein de maths indique supérieur, je préfère ne pas lire supérieur ou égal. Je ne m'étonne pas qu'il y ait une divergence, puisqu'il y a deux approches, l'une dite fréquentiste et l'autre dite bayesienne. Je m'attends à ce que cette différence s'estompe alors qu'augmente la taille de l'échantillon, et c'est le cas : avec n=4, et Smax=40000, les formules donnent respectivement 49999 et 60000 ; avec n=15, 42666 et 43077, moins de 1% d'écart ; à n=46, 40869 et 40909, moins de 1 pour mille. L'article German tank problem (en) donne des raisonnements détaillés pour les deux formules. S'agissant d'un article consacré à l'inférence bayesienne, je ne m'étonne pas que figure la formule obtenue par un raisonnement bayesien, et si vous leur dites que leur raisonnement n'est pas « logique », il faudra sans doute leur indiquer par où il pèche. Sans doute vous diront-ils que votre raisonnement n'est pas rigoureux, puisque vous appliquez des lois valables pour les grands nombres à un cas où les données sont manifestement insuffisantes. Mais je me garderai bien de me prononcer sur la question. PolBr (discuter) 22 juillet 2016 à 19:34 (CEST)[répondre]
En math lorsqu'on utilise supérieur, on sous-entend toujours supérieur ou égal sinon on utilise le terme "strictement supérieur". --Huguespotter (discuter) 22 juillet 2016 à 21:42 (CEST)[répondre]

Pour information des savants & curieux :

  • (en) Paul P. Coggins, « Some General Results of Elementary Sampling Theory for Engineering Use », Bell System Technical Journal, vol. 7,‎ , p. 26-69 (lire en ligne, consulté le ). La formule de Bayes à l'usage des techiciens, par l'exemple. PolBr (discuter) 30 novembre 2013 à 20:04 (CET)[répondre]
  • (en) Edward C. Molina, « Bayes' Theorem - An Expository Presentation », Bell System Technical Journal, vol. 10,‎ , p. 273-283 (lire en ligne, consulté le ) présente le problème posé : « Un évènement s'est produit qui peut avoir eu un certain nombre de causes, trouver la probabilité de chacune de ces causes », des exemples et les controverses de l'époque. PolBr (discuter) 30 novembre 2013 à 20:19 (CET)[répondre]

à coup sûr[modifier le code]

Le 21 juillet 2016 à 17:54 François-Dominique (d · c · b) ajoute en note la réflexion suivante

« Stricto sensu, du fait de la définition de la probabilité par l'intégrale de Lebesgue, à coup sûr reste une approximation. La probabilité pour qu'en tirant un nombre réel au hasard (caractère par caractère, par exemple) ont tombe sur un entier ou un rationnel est nulle. Les entiers et les rationnels n'en existent pas moins. On est ici à la frontière entre les mathématiques et l'ontologie. »

Ça n'a pas un caractère d'évidence, ça ne se rapporte que marginalement au sujet, ça n'est pas sourcé : il y a lieu de se demander si l'article ne se porterait pas mieux sans

Ça n'a pas un caractère d'évidence
quelle méthode pratique peut-on proposer pour tirer un nombre réel au hasard ? En pratique, on ne peut tirer au hasard que des nombres pris dans une énumération ; la proportion de rationnels dans l'énumération donnera une probabilité d'en tirer.
Ça ne se rapporte que marginalement au sujet
L'inférence bayésienne « s'intéresse aux cas où une proposition pourrait être vraie ou fausse, non pas en raison de son rapport logique à des axiomes tenus pour assurément vrais, mais selon des observations où subsiste une incertitude ». Il est donc parfaitement évident qu'on aura jamais de probabilité 0 ou 1, sans faire appel ni à Lebesque, ni à l'ontologie.

PolBr (discuter) 21 juillet 2016 à 20:30 (CEST)[répondre]

Quel rapport avec le sujet[modifier le code]

Après avoir lu ce qu'on peut trouver sur les sources citées, je ne parviens pas à cerner le rapport avec le sujet du passage suivant, que François-Dominique (d · c · b) a inséré le 14 novembre 2016 dans la section #Prise de décision bayésienne et neurosciences et que j'ai d'abord mis en forme :

« L'introduction du cours Coursera « Neural Networks for Machine Learning » de résume en une phrase l'intérêt de l'approche bayésienne : « Il ne peut exister aucune règle à la fois simple et fiable. Nous avons besoin de combiner entre elles un très grand nombre de règles faibles [a] ». L'auteur ajoute que de surcroit de nouvelles règles faibles devront pouvoir s'ajouter aux autres au cours du temps, et que la pertinence de chaque règle devra être jugée à l'aune de sa participation aux bons résultats, et son poids réévalué en conséquence.

  1. « There may not be any rules that are both simple and reliable. We need to combine a very large number of weak rules[1] ».
  1. « Neural Networks for Machine Learning » par Geoffrey Hinton, novembre 2016 [source insuffisante].

 »

Il s'agit d'un cours de programmation de réseau neuronal, et non de neurosciences. La source indiquée existe, mais le texte cité ne s'y trouve pas. Le texte cité n'a pas de rapport évident avec le raisonnement bayesien. Il me semble donc qu'il ne s'agit que de publicité pour un cours en ligne. PolBr (discuter) 14 novembre 2016 à 09:16 (CET)[répondre]

La source indiquée existe, mais le texte cité ne s'y trouve pas.
Il est au contraire dans le texte d'introduction, que chacun peut consulter s'il est inscrit. Et comme ce cours est gratuit, on ne voit guère de "publicité" possible (seules les certifications sont facturées, comme il est habituel sur Coursera).
Rappelons par ailleurs que les techniques neuronales font partie des neurosciences : il s'agit de la même discipline consistant à modéliser la prise de décision opportune à partir de nombreux facteurs eux-mêmes chacun peu fiable parce que bruité. François-Dominique (discuter) 18 novembre 2016 à 00:51 (CET)[répondre]
Cela est rappelé dans deux cours au Collège de France : celui de Stanislas Dehaene et celui de Yann LeCun. François-Dominique (discuter) 18 novembre 2016 à 00:53 (CET)[répondre]

Je vous prie de m'excuser de ne lire dans vos réponses que l'expression de votre conviction. Les neurosciences étudient les systèmes biologiques ; tandis que les réseaux neuronaux exploitent une théorie vraisemblable du fonctionnement de ceux-ci pour exploiter informatiquement des données qui auraient en commun avec les phénomènes naturels leur caractère incertain. Il me semble me souvenir qu'il existe aussi d'autres méthodes pour ce faire. Vous n'expliquez pas le lien des réseaux neuronaux avec le raisonnement bayésien ; et si ce lien existe en effet, il y aurait plutôt lieu de l'exposer dans une section spécifique, que de le greffer dans une section où, tout comme moi, de nombreux lecteurs sortiront de la lecture avec l'impression d'un saut du coq à l'âne. Cordialement, PolBr (discuter) 19 novembre 2016 à 15:06 (CET)[répondre]

Cette pièce est-elle biaisée ?[modifier le code]

Cet exemple est un peu frustrant: en pratique, comment en arrivons nous à des estimations à priori de 40dB ou 0dB ?

En passant, il me semble qu'on illustre en creux un inconvénient (ou dumoins une observation cruciale) de la méthode qui mériterait d'être explicitée: si on a initialement des certitudes ("ma pièce est bonne", resp "je suis sur que c'est un menteur"), alors cela empêche totalement d'améliorer notre jugement, que Bayes semble confirmer (la proba a posteriori reste a 0, resp. 1).

( Pour en revenir à l'exemple, on pourrait suggérer de commencer toujours à 0dB. Mais cet "effet bof" ne risque t'il pas d'entraîner ses propres biais, typiquement dans le cas des controverses exagérées genre "complotiste contre certitudes scientifiques consensuelles" ou "j'ai un cliché d'OVNI" ?)

[non signé, 6 juillet 2017 à 17:21‎ 194.199.26.79]

Vous avez parfaitement compris. A priori signifie "avant toute expérience". Si vous avez la foi en la bonté de la pièce, il en faut beaucoup plus pour faire évoluer votre jugement. De même, si vous êtes persuadé que la pièce est truquée. Vous avez sans doute raison de relier ce raisonnement de base à des phénomènes de conviction ; mais ceux-ci sont le fait de groupes, ce qui fait que leur dynamique est plus complexe, voyez Christian MOREL, Les décisions absurdes I, Sociologie des erreurs radicales et persistantes. PolBr (discuter) 6 juillet 2017 à 23:21 (CEST)[répondre]

Relecture du RI[modifier le code]

Je retire du RI le texte suivant en note. Il est peu à même d'aider à la compréhension du sujet, dépend trop de la notion de nombre réel et par là ne s'applique guère au texte. Le nombre réel est purement mathématique, il n'existe pas dans la réalité (et notamment dans les mesures toujours affectées d'une incertitude), alors que le résumé explique précisément que l'inférence bayésienne s'applique à des cas où existe l'incertitude. « Stricto sensu, du fait de la définition de la probabilité par l'intégrale de Lebesgue, à coup sûr constitue un abus de langage si l'on est dans le domaine du continu. La probabilité pour qu'en tirant au hasard les décimales d'un nombre réel (caractère par caractère, par exemple) on tombe exactement sur un entier ou sur un rationnel est nulle. Les entiers et les rationnels n'en existent pas moins. On est ici à la frontière entre les mathématiques et l'ontologie. (Philippe Formery, cours de probabilités 2ème année, Ecole des Mines, circa 1970) ».

Si François-Dominique (d · c · b), le contributeur de cette notion, estime qu'elle est indispensable, il faudrait donner les précisions, avec leur source, en section. L'énoncé du RI précise bien intervalle ouvert. Quand la probabilité est exprimée en log (p/(1-p)), le 0 et le 1 deviennen ±∞, ce qui exprime mieux l'idée que ces valeurs ne peuvent être atteintes. Sans doute le passage qui traite de la notation logarithmique pourrait supporter l'explication de la note.

J'ai également retiré la phrase « Le théorème de Cox-Jaynes codifie et quantifie la démarche d'apprentissage. Jaynes utilisait à ce sujet avec ses étudiants la métaphore d'un robot à logique inductive ». Elle ne correspond à aucun développement en section. PolBr (discuter) 28 septembre 2018 à 10:19 (CEST)[répondre]

Article "fucked up beyond all recognition"[modifier le code]

L'article initial considérait comme il se doit le besoin d'établir des estimations à partir des observations et montrait, comme le faisaient Cox et Jaynes, que les compositions de plausibilités obéissaient aux même lois que les compositions de probabilités, justifiant ainsi l'unification de deux terminologies. Dans l'article tel qu'il existe, les probabilités arrivent comme un cheveu dans la soupe, sans la moindre justification.

Il importe de comprendre que le lecteur moyen peut rester sceptique sur la notion de probabilité qu'il y ait du pétrole à un endroit, car soit il y en a, soit il n'y en a pas. Ce que nous manifestons par la probabilité n'est en aucun cas la limite d'une fréquence, mais bien notre état de connaissance. Cette probabilité sera différente pour deux camions prospecteurs en des phases différentes de leur prospection au même endroit et au même moment L'article actuel escamote totalement cet aspect des choses, laissant croire à l'existence de "probabilités objectives", introduisant une objectivité qui n'existe pas. Toute probabilité est subjective. 82.226.27.88 (discuter) 23 avril 2019 à 15:42 (CEST)[répondre]

Bien, en attendant, les propriétés et théorèmes utilisés concernent les probabilités. Une référence est nécessaire pour changer le vocabulaire de l'intro, par ex. Cdt. Lylvic (discuter) 25 avril 2019 à 08:36 (CEST)[répondre]
Revenant à la version initiale du 22 août 2004 à 16:24 par François-Dominique (d · c · b), je ne peux qu'être d'accord avec le sévère jugement de 82.226.27.88. Des tas d'éléments techniques sont venus noyer le poisson. Le théorème de Bayes ne fait pas l'inférence bayésienne, il figure dans tous les manuels de probabilités. Il faudrait plutôt expliquer en quoi l'« inférence bayésienne » se distingue des autres inférences statistiques. Ce n'est pas que l'article initial réponde à cette demande, c'est que les développements en éloignent. Je trouve aussi que l'article recourt très peu à la documentation. Myron Tribus, source de l'article initial, a publié il y a 50 ans, et dès qu'on discute, on me dit qu'on n'en est plus là.

Sauf erreur de ma part, le sujet concerne le sens des termes inférence, fréquence statistique, probabilité, espérance de qqch, bien plus que les calculs qu'on fait sur des tests et des échantillons. PolBr (discuter) 9 août 2021 à 11:45 (CEST)[répondre]
Source francophone récente : Christian P. Robert, « Des spécificités de l'approche bayésienne et de ses justifications en statistique inférentielle », dans Isabelle Drouet (dir)., Le bayésianisme aujourd’hui - Fondements et pratiques, Paris, Éditions Matériologiques, , 504 p. (ISBN 978-2-37361-078-9, présentation en ligne), p. 223-245. PolBr (discuter) 9 août 2021 à 15:17 (CEST)[répondre]

Conversion dB / bit[modifier le code]

Il me semble que l'expression EvdB=3,03 Evbit prête à confusion car, pour tout matheux, la correspondance est inverse : 1 bit = 3,03 dB ce qui correspond d'ailleurs au tableau fourni : 2 bit = 6 dB et ce qui correspond aussi à mes propres calculs.

Donc la conversion de 1,76 dB donne, selon moi 1,76/3,03 = 0,58 bit.

Notification Dfeldmann : Où serait notre erreur? HB (discuter) 8 juin 2019 à 08:44 (CEST)[répondre]

Notification HB et PolBr :Bon, soyons clair : on a A=EvdB (p)=10 log(_10) X et B=Evbit (p)=log(_2) X (avec X=p/(1-p), mais peu importe). Donc A=3,0103 B, et donc en effet 1 bit (c-à-d B=1) correspond à A= 3,0103 (dB). Maintenant, si A=1,76 dB , on doit avoir B=A/3,01= 0,58... et je vous dois à tous deux de plates excuses (et plus encore pour m'être agacé de l'intervention de PolBr ; j'ai vraiment honte). Confus et repentant,--Dfeldmann (discuter) 8 juin 2019 à 09:18 (CEST)[répondre]
P.S. Cela dit, s'il y avait un écart plus important entre multiplication par 3,01 et division par 0,301 , ce genre d'erreur sauterait davantage aux yeux Émoticône sourire--Dfeldmann (discuter) 8 juin 2019 à 10:03 (CEST)[répondre]
Remarques:
  1. Les deux valeurs 0,53 et 0,58 sont fausses l'une et l'autre. Il s'agit d'échantillons d'un effectif de 40. Les évaluations de probabilité devraient avoir un chiffre significatif, deux au plus. Je n'ai rien à redire contre la probabilité 0,6 ni contre l'évidence 0,6/(1-0,6) = 1,5, mais les conversions sont, à mon avis, fautives. Pour se rendre compte de l'effet de la taille de l'échantillon, il suffit d'incrémenter la plus faible valeur. Si donc la boïte A contient 9 biscuit ordinaires, la probabilité p(D | HA) devient 31/40 = 0,775 et l'évidence 775/225 ≈ 3,4 (5,4 décibans ou 1,8 shannons. On voit que les troisièmes chiffes ne correspondent qu'à une volonté d'impressionner.
  2. L'usage métonymique du mot décibel pour un objet qui n'a rien à voir pourrait passer ; de toutes façons, l'inférence bayésienne sert principalement pour convaincre, ce qui est bien du domaine de la rhétorique. Mais le décibel est destiné à des évaluations rapides et des calculs mentaux. On néglige toujours les décimales. On a ici une « évidence » de 1,5, soit 3/2. Le log de 3/2 est log de 3 moins log de 2. À toutes fins utiles, un facteur 3 c'est 5 dB, un facteur 2 c'est 3 dB, donc un facteur 1,5 c'est 5-3=2 dB.
  3. Le bit est hors de propos ici, c'est le shannon l'unité.
PolBr (discuter) 8 juin 2019 à 14:42 (CEST)[répondre]
Bon je n'ai pas tout compris aux objections de PolBr (0,58 n'est pas faux mais a peut-être une précision inadaptée) et n'était venue que pour aider à corriger une erreur de calcul. Je suppose que la pertinence d'une précision à deux décimales peut être sujette à discussion, tout comme un arrondi à l'unité; dans ce cas, mieux vaut regarder ce que font les sources. Il en est de même de l'utilisation de de shannon au lieu de bit. Pour le contenu de l'article et les choix à effectuer, je vous laisse discuter tranquillement et me sens vaguement incompétente. HB (discuter) 8 juin 2019 à 21:33 (CEST)[répondre]

Où çà, une "traduction" ?[modifier le code]

"La traduction de cet article ou de cette section doit être revue (juillet 2021).

Le contenu est difficilement compréhensible vu les erreurs de traduction, qui sont peut-être dues à l'utilisation d'un logiciel de traduction automatique."

Ayant écrit la majeure partie de cet article, et cela dans ma langue maternelle, je ne vois pas de quelle traduction il serait question. Quelques citations seraient les bienvenues. 77.204.105.149 (discuter) 8 août 2021 à 13:38 (CEST)[répondre]

  • Notification LD : vs avez posé le bandeau le 24 juillet 2021 à 00:05 (après Théorème de Bayes du 23 juillet 2021 de 22:20 au 24 juillet 2021 à 00:07 ; Discussion:Théorème de Bayes le 23 juillet 2021 à 22:57 ; Probabilité a priori, ‎Ajout de {{Style non encyclopédique}} le 23 juillet 2021 à 23:08 ; Inférence bayésienne 24 juillet 2021 à 00:02). Pourriez-vous préciser ce qui vous fait penser à une traduction et ce qui vous semble plus difficilement compréhensible que la difficulté normale d'aborder une nouvelle façon de penser ?‎ PolBr (discuter) 8 août 2021 à 14:47 (CEST)[répondre]
    Bonjour, la voix passive que vous aviez corrigée, certaines expressions comme "auto-apprentissage machine" ou d'autres que j'ai corrigées m'ont fait penser à une traduction littérale ou automatique. Je ne suis pas disponible dans l'immédiat pour compléter ma réponse, mais l'article est à relire et vérifier quant au style ou aux informations qu'il fournit. Il y a des équivalents francophones pour les concepts. Peut-être que tout a déjà été corrigé, je n'avais pas eu le temps de le relire entièrement. Cordialement. LD m'écrire 8 août 2021 à 17:06 (CEST)[répondre]