Discussion:Loi de probabilité à plusieurs variables

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

précaution de langage[modifier le code]

Au début du paragraphe Formules de base on lit La probabilité pour que la variable aléatoire X, prenne une valeur numérique inférieure à x, tandis que Y, prend une valeur inférieure à y. Je suggère de remplacer tandis que par et, car tandis que suggère une probabilité conditionnelle, ce que l'expression mathématique qui suit contredit.


Un important chantier à envisager[modifier le code]

Cet article appelle un certain nombres de remarques, à cheval entre les questions de forme et les questions de fond. Sans être exhaustif,

  1. Prenons acte de l'avertissement liminaire : « Seules les variables continues sont considérées. Il est possible de passer aux variables discrètes en utilisant la fonction de Heaviside et la fonction de Dirac ». On peut déjà regretter que cet avertissement ne soit pas davantage mis en évidence, tant il est vrai que ce qui suit ne peut bien sûr avoir de sens que dans le cas de variables aléatoires absolument continues. Peut-on affirmer qu'un lecteur non spécialiste aura suffisamment pris en compte cette restriction ?
  2. Par ailleurs, la tournure « …passer aux variables discrètes en utilisant… la fonction de Dirac » est pour le moins évasive et on peut douter qu'elle puisse aider ce même lecteur non spécialiste à transposer correctement les formules qui vont suivre au cas des variables discrètes. Sans compter que rien n'est dit au sujet du cas général, les lois multivariables qui ne sont ni absolument continues, ni discrètes. On peut se demander s'il n'aurait pas mieux valu explicitement inscrire dans le titre de l'article qu'on se limiterait ici à « Loi de probabilité absolument continue à plusieurs variables » .
  3. Au passage, il faut regretter l'expression fautive « fonction de Dirac ». L'objet mathématique ainsi désigné n'est pas, et ne peut pas être, une fonction ! Du reste, l'article pointé par cette désignation fautive a pour titre Distribution de Dirac, et le moins qu'on puisse dire est que la distinction n'est pas mince ! Et cet article ainsi pointé commence judicieusement par la mise en garde « …peut être informellement considérée comme une fonction δ qui prend une « valeur » infinie en 0, et la valeur zéro partout ailleurs, et dont l'intégrale sur ℝ est égale à 1 » ; mais cette mise en garde elle-même est selon moi trop timide, et n'insiste pas assez sur le fait que l'objet ainsi décrit est un monstre qui ne peut pas exister : distribution, d'accord ; mesure, d'accord aussi ; mais fonction, certainement pas.
  4. La remarque précédente pose une question de fond. Même si une faute est courante et pour ainsi dire populaire, est-ce le rôle d'une encyclopédie de lui donner droit de cité, et de contribuer à la pérenniser ? Le respect dû au lecteur n'exigerait-il pas au contraire qu'un effort de rigueur et de pédagogie permette de s'affranchir de la faute courante, surtout naturellement lorsqu'il s'agit d'un article scientifique ?
  5. Question de pure forme, d'harmonisation entre (je le suppose) la contribution de plusieurs rédacteurs. Entre les paragraphes 1 d'une part, et 3 et 4, le même objet (la densité bivariable) est noté une fois et une fois . C'est, pour le moins, inesthétique, et cela risque de dérouter le lecteur non spécialiste qui pourrait chercher un sens caché à cette hésitation entre notations. À titre purement personnel, je me déclare très fortement opposé à la seconde écriture : certes, il est clairement écrit que cette notation désigne une densité de probabilité, mais l'apparition de la lettre pourrait suggérer insidieusement que cet objet désigne une probabilité, ce qui serait grossièrement faux. Bien sûr, on pourrait ici m'accuser de procès d'intention, car la faute n'est pas explicite dans le présent article ; mais j'essaie de me mettre à la place d'un lecteur non spécialiste, et je sais aussi par expérience à quel point un choix malencontreux de notations peut être dévastateur. Cela dit, force est de constater que l'amalgame entre « probabilité » et « densité de probabilité » se trouve ailleurs encore plus clairement suggéré sur Wikipédia (ce qui ne constitue en rien une excuse, naturellement). En résumé, si le choix de cette notation ne constitue pas en soi une erreur, il incite probablement à l'erreur et rien que cela devrait pousser les rédacteurs à la prudence.
  6. Le plus grave sans doute, maintenant. Rien dans cet article n'exprime clairement le fait qu'en toute généralité, une loi multivariable (une « loi jointe ») ne s'exprime pas par une fonction de densité. Certes, l'introduction a bien précisé (cf. le point 1. ci-dessus) que l'article ne traitait que des variables continues. Mais si on prend au pied de la lettre inconsidérément les modalités pour passer au cas discret (cf. point 2.), il faudrait en conclure qu'avec l'aide de la fonction de Heaviside et la mesure de Dirac, on pourrait arriver à une expression de densité valable pour les variables discrètes. Or, et personne n'y peut rien, une variable discrète n'admet pas de densité ! Autrement dit, une formulation qui en soi n'est pas entièrement fautive risque inexorablement de pousser à la faute ! C'est pour le moins tragique dans un article encyclopédique. Disons que le minimum serait que soit écrit quelque part dans cet article, noir sur blanc, qu'il existe des lois multivariables qui n'admettent pas de densité.
  7. Un détail ironique, qui souligne que cet article est plein de pièges pour le lecteur non spécialiste, et non satisfaisant pour un lecteur un peu plus au fait du domaine. Admettons que ce lecteur sache, ou accepte, cette vérité que la fonction de répartition existe toujours. Mais alors, on pourrait imaginer les questions que pose la formule :
    Est-ce à dire que est toujours deux fois dérivable ? Et si ce n'est pas le cas, que signifie cette formule ? Sauf erreur, cet article ne permet pas de répondre à cette question qui pourtant devrait se poser à un lecteur attentif.
  8. Juste au passage, une remarque également au paragraphe 2. En toute rigueur, il est faux de dire que l'espérance de la somme est toujours la somme des espérances : après tout, si et si par ailleurs n'admet pas d'espérance, l'espérance de sera bien évidemment nulle alors que chacune des espérances prise séparément n'aura pas d'existence. Autrement dit, dans la relation
    le membre de gauche vaudra 0 alors que celui de droite n'aura pas de sens ! De nouveau, il s'impose un effort de rigueur dans les énoncés.
  9. Je me contenterai de sauter à la dernière phrase : « La notion de variables décorrélées est plus faible que celle d'indépendance et est loin d'avoir la même utilité ». La première partie est indiscutable, et du reste ne fait que reprendre la phrase précédente (l'indépendance implique la non-corélation, la réciproque étant fausse). Mais quel sens faut-il donner à la fin de cet énoncé ? Après tout, lorsqu'on passe aux applications, l'indépendance est une propriété rigoureusement invérifiable expérimentalement, et il s'agit finalement d'une propriété du seul modèle mathématique ; au contraire, la non-corrélation peut être numériquement testée, à des degrés de précision décidés à l'avance, avec un seuil de confiance fixé par des théorèmes de convergence. Est-ce ce que veut exprimer l'étrange expression « loin d'avoir la même utilité » ?


En résumé, cet article me semble exiger une très sérieuse refonte, après harmonisation des points de vue des rédacteurs. En l'état, il me paraît être plutôt dangereux pour les lecteurs non avertis.

Baron de Clappique (d) 8 avril 2013 à 14:30 (CEST)[répondre]

L'article contient 5244 octets, le commentaire 8087 octets : en clair l'article doit être entièrement rejeté ou peut-être faut-il admettre que, dans ce domaine comme dans d'autres, il existe différents niveaux de langage. C'est l'éternel problème d'une encyclopédie. Est-ce un monument rédigé pour les seuls spécialistes capables de relever la moindre imprécision et qui, je l'espère pour eux, n'en ont pas besoin pour s’informer ? Ou pour les non-spécialistes qui cherchent à s'informer sur une notion qu'ils maîtrisent mal, ce qui impose des approximations ?
Ici le problème prend un aspect particulier si on se réfère à l'histoire. Les physiciens ont inventé la « fonction de Dirac » pour décrire la physique quantique avant d'avoir la moindre idée sur ce qu'est une distribution. Qui a l'envergure suffisante pour leur opposer que l'on « n'insiste pas assez sur le fait que l'objet ainsi décrit est un monstre qui ne peut pas exister » ? C'est, pour moi, la « question de fond ».
On insiste alors sur « le plus grave, sans doute » : « une variable discrète n'admet pas de densité ! » C'est la conclusion logique de l'interdiction d'affecter une fonction de Dirac à une variable discrète, interdiction dont s'affranchissent les utilisateurs des probabilités pour pouvoir travailler, comme le faisaient à un niveau beaucoup plus élevé les fondateurs de la physique moderne.
L'expression « loin d'avoir la même utilité » n'est compréhensible que pour ceux qui utilisent concrètement les applications des probabilités, pas pour ceux qui se situent au niveau des théorèmes de convergence.
Reste que, comme dans tout article, de nombreuses affirmations peuvent être modifiées. Si on introduit tous les théorèmes d'existence, de convergence on écrit un autre article, intéressant pour tous ceux qui se situent à l’affût de la moindre imprécision, pas pour ceux qui se demandent quelles sont les caractéristiques d'une loi à plusieurs variables.--Jct (d) 8 avril 2013 à 17:18 (CEST)[répondre]