Utilisateur:Gouvernathor/À la recherche de la meilleure répartition

Quelle est la meilleure répartition ?

Les méthodes de répartition[modifier | modifier le code]

La répartition est la manière de distribuer équitablement un nombre donné et réduit d'items entre plusieurs entités, à partir d'un score attribué à chaque entité. En général, les items sont des sièges au sein d'une assemblée, et le score est un nombre de votes reçus dans une élection : la répartition est le moment où chaque parti reçoit un nombre de sièges après un scrutin de listes. C'est aussi utilisé en utilisant la population comme score pour répartir des sièges entre des subdivisions au sein d'un état fédéral.

Généralement, la répartition tourne autour de la notion de proportionnalité, pour que le nombre d'items soit proportionnel au score, mais plusieurs facteurs peuvent - parfois en toute connaissance de cause - biaiser ou empêcher cette proportionnalité. Le collège électoral pour le président des états-unis, par exemple, est intentionnellement biaisé de façon à ce que chaque état obtienne au moins 3 grands électeurs, et que le nombre d'électeurs d'un état suive (plus ou moins) une fonction affine par rapport à la population, avec une valeur proportionnelle + 2.

Dans cette article, le but va être d'essayer de trouver la meilleure méthode de répartition, la plus juste, la plus proportionnelle.

Répartition proportionnelle[modifier | modifier le code]

Une Chambre parlementaire doit être remplie de députés. Une élection a eu lieu, attribuant des voix à une série de partis. Il semblerait juste d'attribuer les sièges de manière à ce que le pourcentage des sièges de la chambre, pour un parti donné, corresponde (autant que possible) au pourcentage de votes qu'il a reçu. Le pourcentage de voix reçu par le parti A (par rapport à tous les votes comptés pour tous les partis) sera noté $t_{A}$ .

Le problème, c'est qu'on ne peut pas diviser les sièges, donc à un moment ou à un autre, il faudra utiliser des approximations.

Il y a un nombre théorique, à virgule, de sièges pour chaque parti, qui est leur pourcentage de votes multiplié par le nombre total de sièges. Cette valeur sera appelée le nombre idéal de sièges. Pour un parti recevant un tiers des voix, et une Chambre de 200 sièges, ce nombre est de 66,666 sièges ; pour une Chambre de 100 sièges, le nombre idéal est de 33,333. Pour le parti A, il sera noté $q_{A}$ . Évidemment, comme c'est un nombre décimal, il est inatteignable. Toute la difficulté va être d'arrondir cette valeur pour chaque parti de la manière la plus équitable. Le nombre final de sièges alloués sera noté $a_{A}$ , et le nombre total de sièges, $h$ . Donc, $q_{A}=t_{A}.h$ .

Une idée initiale pourrait être d'arrondir chaque valeur idéale à l'entier le plus proche, mais ça ne marche vraiment bien que quand on n'a que deux partis à faire siéger, sinon des problèmes s'installent. Prenez l'exemple précédent avec une Chambre de 100 sièges. Chaque parti reçoit 33 sièges... et un siège n'est pas attribué. Plus problématique, pour les mêmes votes et un total de 200 sièges, chaque parti reçoit 67 sièges... et on finit avec 201 sièges attribués. Oups.

Une idée un poil moins contraignante serait de rendre au moins nécessaire à chaque nombre de sièges d'être compris entre l'arrondi inférieur et l'arrondi supérieur de la valeur idéale. Cette contrainte est appelée la règle du Quota.

La règle du Quota[modifier | modifier le code]

La méthode faite pour respecter cette règle est dite au plus fort reste, ou encore de Hare ou de Hamilton dans le monde anglophone, et elle a pour avantage d'être une des plus faciles à calculer à la main en conditions réelles (ce qui présente un avantage démocratique indéniable, il faut bien le reconnaître).

Cette règle du Quota est particulièrement intuitive, mais nous allons voir en quoi en réalité elle ~~est nulle à ch~~ n'est pas équitable du tout, et n'a pas vraiment de sens mathématique. Pour montrer ça plus clairement, je vais prendre l'exemple des impôts.

Imaginons que quelle que soit la formule utilisée pour calculer combien chacun doit à l'état, il y aura une certaine erreur dans le montant prélevé, comprise dans une marge d'erreur donnée. Certains doivent des millions à l'état, certains des milliers d'euros, certains rien du tout. Est-ce que ça semblerait juste si la marge d'erreur était de ±100€, ou de ±1 000€, c'est-à-dire basée sur une quantité fixe d'argent ? Non, parce que quand on doit 5 000€, avoir une erreur de +1 000€ est bien plus important et injuste que quelqu'un devant 50 000€ et recevant la même erreur de +1000€. C'est bien plus juste et équitable d'avoir une marge de pourcentage d'erreur, par exemple ±10% de ce qu'on doit. Comme ça, pour quelqu'un qui doit environ 5 000€ l'erreur est de ±500€, et pour quelqu'un qui doit 50 000€ elle est de ±5 000€. Ce n'est toujours pas idéal (le mieux serait de ne pas avoir de marge d'erreur du tout), mais au moins c'est réparti plus équitablement entre les petits et les gros payeurs.

C'est pareil pour la répartition. La règle du Quota implique que l'arrondi sera d'au pire ±1 siège, cependant 1 siège n'a pas la même valeur pour les petits et les gros partis. Cette règle est donc particulièrement injuste dans sa manière de trancher les arrondis, et elle est souvent décrite comme tranchant de manière "aléatoire" - ce qui n'est pas vrai stricto sangsue, mais dans l'idée, un peu quand même.

Un symptôme de ce quasi-aléatoire, c'est que les méthodes qui implémentent cette règle du Quota doivent par nature en briser une autre, appelée en anglais House monotonicity. Cette autre règle - mal traduisible, surtout qu'il y a plusieurs monotonies possibles... disons la "monotonie de chambre" faute de mieux - dit que quand on garde le même nombre de votes pour chaque parti et qu'on ajoute un siège au total, aucun parti ne devrait perdre de siège. Or, ça arrive fréquemment avec la méthode au plus fort reste, c'est l'effet appelé Paradoxe de l'Alabama.

La grande famille des méthodes qui s'affranchissent de la règle du Quota pour au contraire respecter la monotonie de chambre sont les méthodes à la plus forte moyenne, avec de très nombreuses variantes : d'Hondt/Jefferson, Webster/Sainte-Laguë ou Adams pour citer les trois plus connues.

La plus forte moyenne[modifier | modifier le code]

Le trio des plus répandus[modifier | modifier le code]

Je vais décrire en deux mots ces trois méthodes, parce que c'est intéressant, avant de montrer en quoi elles sont toutes les trois mauvaises. Si vous voulez uniquement voir la meilleure répartition, vous pouvez donc passer cette section un peu plus velue niveau maths.

Ces trois méthodes font appel (dans la manière que j'ai choisi pour les expliquer, du moins) à une métrique appelée parfois le "ratio d'avantage", qui est le pourcentage des sièges contrôlés par un parti ( $a_{A}/h$ ), divisé par le pourcentage des voix reçues ( $t_{A}$ ). Plus il est gros, plus grand que 1, et plus le parti a reçu des sièges "en trop" par rapport à son nombre idéal $q_{A}$ . Le ratio d'avantage est en fait égal à $a_{A}/q_{A}$ .

La méthode d'Hondt donne à chacun le nombre de sièges idéal arrondi par défaut, puis distribue les sièges restants de manière à ce que le ratio d'avantage des plus gros partis soit le plus petit possible. Il en résulte un net avantage pour les plus gros partis : il a même été démontré que c'est celle des méthodes à diviseur (une catégorie mathématique de méthodes dont ces trois font partie, je ne rentre pas dans le détail) qui favorise le plus les plus gros partis.

La méthode d'Adams fait un peu l'inverse : elle donne à chacun le nombre de sièges idéal arrondi par excès, puis retire des sièges pour atteindre le nombre de sièges à distribuer de manière à ce que le ratio d'avantage des plus petits partis soit le plus grand possible. Un effet secondaire intéressant, c'est que quand un parti reçoit une seule voix, une fois arrondi par excès il obtient automatiquement un siège... cette méthode est donc généralement assortie d'un seuil de représentation ou de bidouillage mathématiques sur le premier siège, ce qui l'éloigne automatiquement de l'idée de proportionnalité.

La méthode de Webster est la plus équitable : on va attribuer à chaque parti son nombre idéal arrondi... tout court, à l'entier le plus proche. Ensuite, en en ajoutant ou retirant des sièges en fonction de si l'arrondi nous a fait dépasser ou non le nombre de sièges recherché ( $h$ ), on va chercher à minimiser la moyenne du ratio d'avantage de chaque parti.

Le problème organique[modifier | modifier le code]

Le problème de ces trois méthodes, et de la quasi-totalité des méthodes à plus forte moyenne connues, c'est justement la formule de ce ratio d'avantage, qui reproduit d'une certaine manière le même problème de fond que la règle du Quota. La règle n'est plus assez bornée pour dire "pas plus d'un siège d'écart dans un sens ou dans un autre", mais elle a quand même un problème méthodologique, du fait que comparer le simple pourcentage de sièges contrôlé n'est pas juste.

Pour un parti A avec $q_{A}=49.999$ sièges idéaux théoriques qui reçoit $a_{A}=49$ sièges, et un parti B avec $q_{B}=2.8$ idéaux qui reçoit $a_{B}=2$ sièges, l'arrondi est plus grave dans le cas de B que dans le cas de A. A a perdu $q_{A}-a_{A}=.999$ sièges, mais il a perdu $1/50=2\%$ de son nombre théorique de sièges, alors que les $a_{B}-a_{B}=.8$ siège perdu par B représente $2/7\approx 28.57\%$ de son nombre théorique de sièges, ce qui est bien pire.

Dans cet exemple comme dans l'exemple des impôts, j'ai montré des entités plus petites se faire avoir par la méthode de calcul, mais ça marche aussi dans l'autre sens : si on accordait plus de sièges aux partis que ce qu'ils méritent, le calcul permettrait un dépassement bien plus grand pour les petits partis que pour les grands, ce qui serait cette fois injuste envers les grands. In fine, le problème n'est pas que la méthode favorise les petits ou les gros partis, c'est qu'elle arrondit les petits partis d'une manière toujours plus approximative que les gros - que cet arrondi soit par défaut, ou par excès, ce qui, au final, peut se retourner contre n'importe qui.

La méthode la plus juste serait donc d'optimiser non pas sur le pourcentage de sièges dans l'assemblée, mais sur le pourcentage de sièges obtenus sur le nombre de sièges idéal.

La proportionnalité de l'erreur[modifier | modifier le code]

Introduisons une nouvelle métrique : l'erreur brute est le nombre de sièges qu'on obtient, moins le nombre idéal théorique de sièges auquel on a droit. Elle sera notée $e_{A}=a_{A}-q_{A}=a_{A}-t_{A}.h$ . Elle représente le nombre de sièges qui nous est dû mais qu'on n'a pas, ou si elle est positive, le nombre de sièges qu'on a reçu en plus de notre nombre théorique. À un facteur $h$ près (fixe, donc), elle est proportionnelle - donc équivalente à optimiser - avec $e'_{A}=a_{A}/h-t_{A}$ , qui est le pourcentage des sièges alloués au parti A, moins le pourcentage des votes qu'il a reçu.

L'erreur brute est grosso modo semblable au ratio d'avantage, en ça qu'elle est toujours exprimée en nombre de sièges - mais comme on l'a vu, un siège, ou même un dixième de siège, ne signifie pas la même chose pour un parti qui en a à peu près 150 que pour un parti qui en a à peu près 20.

Même en prenant la deuxième version de l'erreur brute écrite plus haut ( $e'_{A}=a_{A}/h-t_{A}$ ), elle est toujours exprimée comme un pourcentage du nombre total de sièges, donc par le même raisonnement, 1% de l'assemblée ne représente pas la même chose pour quelqu'un qui en contrôle 45% que pour quelqu'un qui en contrôle 5%. Pour reprendre l'exemple des impôts, exprimer la marge d'erreur comme un nombre d'euros ou comme un pourcentage du nombre total d'euros en circulation, c'est exactement la même chose. Au contraire d'un pourcentage de ce qu'on doit ou ce à quoi on a droit.

Ce qui serait réellement équitable serait donc de prendre quelque chose qui soit proportionnel à ça : à $q_{A}$ , le nombre de sièges auxquels on a droit (ou à $t_{A}$ , l'équivalent sous forme de pourcentage). Faisons donc une nouvelle métrique, l'erreur proportionnelle, notée $p_{A}=e_{A}/q_{A}=(a_{A}-q_{A})/q_{A}=(a_{A}-t_{A}.h)/(t_{A}.h)=(a_{A}/h-t_{A})/t_{A}=e'_{A}/t_{A}$ (la deuxième version utilisant $e'_{A}$ est généralement plus rapide à calculer quand on le programme). L'idée de cette erreur proportionnelle est la suivante : plus on a de sièges, moins il est important qu'on nous en ajoute ou retire un.

Optimiser cette valeur pour chaque parti - soit la valeur moyenne sur tous les partis, soit la somme pour tous les partis, la seule différence est le nombre de partis qui est une constante après que le vote aie lieu - est la marche à suivre pour obtenir la façon optimale, la plus juste, de représenter dans une assemblée la volonté que le peuple a exprimé par le vote.

La méthode P[modifier | modifier le code]

Construisons une méthode de répartition de sièges minimisant cette erreur proportionnelle. Une généralisation des méthodes "à diviseur" que j'ai mentionné plus haut, ce sont les méthodes "rang-index", décrites (en anglais) ici.

Pour résumer, chacune de ces méthodes repose sur une fonction $r(t,a)$ , croissante selon $t$ et décroissante selon $a$ . Une manière de les mettre en œuvre, c'est de calculer $r(t_{A},0\ )$ pour chaque parti et d'attribuer le première siège de l'assemblée au parti ayant la valeur la plus grande, et ensuite, pour chaque siège restant à attribuer, calculer $r(t_{A},a_{A})$ , avec $a_{A}$ le nombre de sièges attribué au parti A à cette étape de la répartition. La particularité caractéristique des méthodes à diviseur est d'avoir une fonction de la forme $r(t,a)={\frac {t}{div(a)}}$ .

Venons-en donc à notre minimisation de l'erreur proportionnelle. En partant de l'idée que la valeur absolue de cette erreur doit être minimisée (puisqu'il est tout aussi grave qu'un parti dépasse ou n'atteigne pas son nombre théorique de sièges), on peut au moment d'attribuer un siège, calculer de combien en serait diminuée l'erreur proportionnelle du parti. Avec $p(t,a)$ la fonction qui en fonction du pourcentage de voix reçues par un parti, renvoie l'erreur proportionnelle de ce parti pour un nombre de sièges donné. Sa formule est $p(t,a)={\frac {{\frac {a}{h}}-t}{t}}={\frac {a}{t\cdot h}}-1$ , avec $h$ le nombre total de sièges à attribuer (une constante, donc).

La valeur dont serait diminuée l'erreur proportionnelle du parti A (donc l'erreur proportionnelle globale sur tous les partis, toutes choses restant égales par ailleurs) en lui attribuant un siège de plus, serait donc de $\left\vert p(t_{A},a_{A})\right\vert -\left\vert p(t_{A},a_{A}+1)\right\vert$ , toujours avec $a_{A}$ le nombre de sièges déjà attribués au parti A. Si on veut une erreur proportionnelle globale minimale, il faut maximiser cette valeur-ci au moment de l'attribution de chaque siège. On peut donc créer une fonction $r$ correspondante, de formule suivante :

{\begin{aligned}r(t,a)&=\left\vert p(t,a)\right\vert -\left\vert p(t,a+1)\right\vert \\&=\left\vert {\frac {{\frac {a}{h}}-t}{t}}\right\vert -\left\vert {\frac {{\frac {a+1}{h}}-t}{t}}\right\vert \\&=\left\vert {\frac {a}{t\cdot h}}-1\right\vert -\left\vert {\frac {a+1}{t\cdot h}}-1\right\vert \end{aligned}}

Comme cette fonction ne peut pas se mettre sous la forme

{\frac {t}{div(a)}}

, ne serait-ce qu'à cause des valeurs absolues, on a la certitude que la méthode P n'est pas une méthode à diviseur. (Avant d'être certain qu'elle est une méthode rang-index, il faudrait prouver que

r

est croissante selon

t

et décroissante selon

a

; la démonstration est triviale et laissée en exercice au lecteur.)

La méthode P est donc toute tracée :

Calculer $t$ pour chaque parti, étant égal au nombre de voix reçues par le parti divisé par le nombre total de suffrages (exprimés).
Puis, autant de fois qu'il y a de sièges à remplir :
1. Calculer $r(t,a)$ pour chaque parti en suivant la formule ci-dessus.
2. Attribuer un siège au parti avec la valeur la plus élevée.

Questions restant à élucider[modifier | modifier le code]

En fait, la fonction $r$ décrite plus haut n'est pas réellement croissante selon $t$ et décroissante selon $a$ : on peut montrer de manière expérimentale (en la traçant sur geogebra avec des valeurs typiques pour t, a et h) qu'elle ne l'est vraiment pas.

La question est donc, la méthode P est-elle quand même une méthode rang-index, même si cette condition n'est pas strictement respectée ?

Cet article (en anglais) montre que toute fonction $r$ satisfaisant l'inégalité suivante : $\min _{i:a_{i}>0}r(t_{i},a_{i}-1)\geq \max _{i}r(t_{i},a_{i})$ crée une méthode rang-index valide. La fonction $r$ , et par extension la méthode P, satisfont-elles cette inégalité ? J'ai réalisé de très nombreuses simulations aléatoires (plusieurs dizaines de milliers), et cette inégalité semble toujours être respectée, mais ce n'est pas une preuve et encore moins une démonstration rigoureuse.

Les méthodes rang-index satisfont tout un ensemble de critères très intéressants pour des méthodes de répartition : elles sont uniformes, house-monotones, population-monotones, symétriques, équilibrées ("balanced")... Lesquels de ces critères sont respectés par la méthode P, si elle n'est pas une méthode rang-index ?

D'autre part, existe-t'il une meilleure méthode d'attribution que la méthode P (et sa fonction associée $r$ ) pour minimiser l'erreur proportionnelle ? Et quelle est la méthode qui minimise l'erreur brute ?

Je n'ai pas encore les réponses à ces questions.

Mise à jour :

Il semblerait que la méthode P viole le critère d'uniformité, au moins dans les cas suivant :


Partis	A	B	C	D	E	F	G	H	I	J	K	L	M
Votes	4865	4274	4180	3950	2787	2573	2487	1761	1258	714	400	139	6
Attribution complète (434 sièges)	72	63	61	58	41	38	37	26	19	11	6	2	0
Attribution partielle (206 sièges)	71		62				37		19	11	6


Partis	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O	P	Q	R	S
Votes	4843	4638	4433	4331	4331	4280	4026	3276	2841	2255	1948	1899	1790	1739	1501	1490	935	770	768
Attribution complète (12 sièges)	1	1	1	1	1	1	1	1	1	1	1	1	0	0	0	0	0	0	0
Attribution partielle (3 sièges)	2	1									0		0	0	0	0	0	0	0

Sauf erreur (de calcul) de ma part, étant donné que les méthodes rang-index sont uniformes, ça implique que la méthode P n'est pas une méthode rang-index.

Je reste curieux quant aux autres critères.