Aller au contenu

Discussion:Liste de sondages sur les élections générales québécoises de 2018

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Graphique des sondages en période électorale de Latuque88[modifier le code]

Premièrement, merci de soumette des graphiques, c'est toujours apprécié sur Wikipédia quand ça complémentarise l'information. Cependant, j'ai annulé ton ajout de ton dernier graphique car je notais 3 problèmes importants :

  • Tu remplaces le graphique des intentions de vote depuis les quatre dernières années qui est un graphique différent et qui reste très pertinent à avoir compte tenu que ça résume toutes les données des sondages que la page contient. Si tu veux ajouter ton graphique, ajoute le avant ou après (en ajoutant aussi le texte approprié).
  • Regrouper plusieurs sondages en un seul est une manière incorrecte de procéder. Ce serait statistiquement "correct" si les dates des sondages seraient les mêmes, mais ce n'est pas le cas ici, donc si tu veux les inclure, inclus les avec leurs dates respectives (tu risques de voir que ça a un effet important sur ta courbe de tendance).
  • Faire une régression à un ordre élevé (3,4,5,6) peut toujours se faire si on a une grande quantité de points. Cependant, plus une régression est d'ordre élevé, plus elle va reproduire les points même si ça créé des irrégularités. Dans le cas qui nous concerne, tu as 6 points sur ton graphique par partis et tu sembles avoir utilisé une régression d'ordre 4 (possède 5 variables qui vont s'adapter aux données) et ça créé justement des irrégularités (par exemple, est-ce que tu penses vraiment que le parti libéral aurait subitement augmenté son appui de 5% en 5 jours subitement pour redescendre tout de suite après?). Si on était certain à 100% du pourcentage de chaque parti (si on ferait une élection à chacune des dates mettons), là à ce moment-là on pourrait prendre une régression d'ordre 4. Mais présentement, comme il s'agit de sondages, il y a des incertitudes/marges d'erreurs importantes sur les données des sondages, alors je ne pense pas qu'on puisse dépasser l'ordre 1 (régression linéaire) dans ce cas-ci.
  • Bonus : C'est difficile pour moi de voir si ça a été respecté, mais saches que chaque sondage a ses marges d'erreurs et son poids (qui est grosso-modo le nombre de sondés). Faire une régression sur ces points-là devrait donc prendre en compte soit de la marge d'erreur ou du poids pour éviter que les sondages qui ont par exemple moins de participants aient plus d'impact sur la courbe de tendance. Disons qu'on ferait un sondage maison avec disons 10 personne, que la moitié voteraient pour QS (ce qui n'est pas impossible pour un faible échantillonnage) et qu'on l'inclurait dans ton graphique, ça affecterait beaucoup trop la régression si il y a rien qui tient compte du nombre de sondés.

En espérant que ça ait aidé! Szeety (discuter) 20 septembre 2018 à 15:19 (CEST)[répondre]