Wikipédia:Bot/Requêtes/2018/03

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
État des requêtes
Requête en cours de traitement En traitement
Requête traitée Traitée
Requête refusée Refusée
Requête en attente d'informations complémentaires Attente d’infos
Requête démarrée puis mise en instance En pause
Requête arrêtée suite à un problème Arrêt / Panne
Requête à archiver sans suite En sursis
Requête non prise en charge depuis un moment Oubliée ?
Requête non prise en charge par un bot Caduque
Requête à archiver sans suite Sans suite
Pages mensuelles : 11 12 01 02 03 04 05 06 07
Archives  : 11 12 01 02 03 04 05 06 07

Requête en attente d'informations complémentaires Page spéciale liée aux pages non catégorisées[modifier le code]

Demande du 11 mars 2018, par : Krosian2B (discuter) 11 mars 2018 à 07:00 (CET)

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :

Si j'ai bien compris Spécial:Pages_non_catégorisées ne recense que les articles du main qui ne possèdent aucune catégorie. Serait-il possible, pour des questions de maintenance, d'avoir une page, mise régulièrement à jour par un bot, qui recense :

  • Les articles du main qui n'ont aucune catégorie en différenciant ceux qui n'en ont réellement aucune et ceux qui ont des catégories cachées mais aucune catégorie visibles ?
  • Les pages des espaces Wikipédia: Aide: Modèle: Catégorie: qui n'ont aucune catégorie.
Notification Krosian2B : Bonjour, je me suis amusé à programmer mon bot en PHP et j'ai réussi à demander à wikipedia de ressortir la liste des catégories présentes sur une catégorie (il est capable de faire la distinction caché ou non) lorsqu'on lui rentre le nom d'un article. Maintenant on arrive à la deuxième phase du problème : vu qu'il est hors de question de faire tourner le bot sur l'ensemble des pages du wiki, il faudrait se limiter dans les recherches (nbre maxi d'octet, nonredirects, sans liens de langue).
Je propose donc de faire tourner le bot de cette manière :
  • récupérer les articles de petites taille (à déterminer) qui ne sont pas des redirections et sans liens de langue (inter-langues). On peut en effet assumer que les autres articles sont suffisamment conséquent pour être catégorisé.
  • Le script regarde si la page dispose d'une catégorie visible, si oui on passe au suivant, si non ajouter à la liste
  • Mémoriser le dernier article récupéré
  • Enregistrer les logs sur Wikipédia (quelle page ? Une sous-page utilisateur ? De projet ?).
C'est la première fois que je fais tourner mon bot coté serveur, donc n'hésitez pas à faire part de vos remarques et conseils !
Cordialement,— Gratus (discuter) 6 avril 2018 à 06:24 (CEST)
J'ai réussi à oublier la catégorie : il me suffit de mettre à jour la Catégorie:Page non catégorisée via {{À catégoriser}}. — Gratus (discuter) 6 avril 2018 à 15:59 (CEST)
Notification Gratus : heu, je n'ai pas forcément tout compris mais je n'ai pas l'impression que ça résoudrait l'éventuel cas suivant : imaginons que qq1 supprime toutes les catégories visibles d'un long article du main (et possédant une ou plusieurs catégories cachées) mais que personne ne le revert. Il ne serait pas identifié par ce système si je ne me trompe pas, non ? Le problème de {{À catégoriser}} c'est que c'est les contributeurs qui le déposent, ce n'est pas un système automatisé. --Krosian2B (discuter) 6 avril 2018 à 16:37 (CEST)
Notification Gratus : : Si tu veux analyser tous les articles, le plus efficace est d'utiliser les dumps de la base de données. Il y a un dump des catégories (par exemple frwiki-20180401-categorylinks.sql.gz dans https://dumps.wikimedia.org/frwiki/20180401/). Malheureusement, il est difficile à exploiter : il est au format SQL, il n'est pas groupé par page (il faudrait donc prendre une liste des pages séparément et enlever celles qui ont des catégories), et les pages sont identifiées par leur id plutôt que par leur titre.
Si tu utilises l'API plutôt que les dumps, tu peux demander les catégories pour plusieurs pages simultanément (par exemple, trois pages d'un coup). La limite pour les bots est de 500 pages par requête. Ça permet d'aller sensiblement plus vite qu'en les récupérant page par page. Par contre, comme une requête ne renvoie jamais plus de 5000 liens de catégories, il faut parfois faire une requête pour avoir la suite (si les 500 pages prises ensemble ont plus de 5000 catégories).
Il y avait un Projet:Articles sans catégories qui n'est plus mis à jour, mais il donne des informations utiles. En particulier, selon la page du projet, les catégories de naissance et de décès (comme Catégorie:Naissance à Paris je pense) étaient ignorées, car elles ne sont pas suffisantes pour qu'on puisse considérer que l'article est bien catégorisé.
Orlodrim (discuter) 6 avril 2018 à 19:54 (CEST)
Merci Orlodrim Sourire !! Je vais plutôt passer par l'API, étant plus adapté à mon hébergement sans mémoire (et même mon PC en local souffre quand j'ai essayé d'importer la BDD). Quel est le comportement de l'API quand on lui demande les dernières pages ? Il ne renvoie aucun article ou il recommence dans les A ? J'ai vu l'astuce des grands nombres et la bibliothèque botclasses.php m'a économisé quelques heures d’énervements avec l'interface. Le bot est bientôt opérationnel sur l'espace principal (il me reste quelques boucles et sécurités à implémenter). Pour l'instant je ne vais faire que la détection de l'absence de catégorie, afin de voir comment va réagir le serveur avant de lui balancer des regex en plus. — Gratus (discuter) 7 avril 2018 à 07:13 (CEST)
Après le dernier article (🜩 (h · j · )), la liste s'arrête : [1]. Orlodrim (discuter) 7 avril 2018 à 08:19 (CEST)
Orlodrim : Bonjour, et merci ! J'ai finalement réussi à faire un truc opérationnel. Cependant, pour une raison que j'ignore, le bot part en sucette à l'article Comté Baw Baw et boucle en permanence sur elle. Même un arrêt du script avec exit(); ne fonctionne pas : il continue le traitement, me forçant à supprimer directement le fichier du serveur. J'ai mis le lien du code source sur la page utilisateur du Bot.
Lorsqu'on fait la requête à l'API, il ne trouve que lui (?!). J'ai réussi à faire poursuivre le bot de D à DUT1 où il me fait le même type de truc (sauf que là, une suite existe). Lorsque je tente de modifier la valeur de l'article de début (stocké sur un fichier), le site me l'écrase par la valeur précédente, même si je supprime mon index.php. Aurais-je loupé une mise en cache automatique du serveur, à l'instar du cache navigateur qui continue à afficher un contenu absent depuis ? — Gratus (discuter) 9 avril 2018 à 15:57 (CEST)

┌─────────────────────────────────────────────────┘
Bonsoir @Krosian2B, pour répondre à « lister les pages des espaces Wikipédia: Aide: Modèle: Catégorie: qui n'ont aucune catégorie », cette liste donne lesdites pages : quarry:query/12899. Peut-être pourrait-on exclure les sous-pages de cette impression. Les numéros correspondent à leur espaces de nom respectifs. Je mettrait cette liste dans Wikipédia:Rapports par la suite, afin qu'elle soit régulièrement mis à jour et avec des liens corrects. --Framawiki 9 avril 2018 à 19:09 (CEST)

Suivi de la demande :

Remplacer les sections Réception par Accueil[modifier le code]

Demande du 17 mars 2018, par : Olyvar (d) 17 mars 2018 à 18:27 (CET)

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Bonjour, est-ce qu'il serait faisable de remplacer dans les articles sur le cinéma toutes les sections ou sous-sections ayant pour titre "Réception" ou "Réception critique" (ou encore "Sortie et réception") par "Accueil" ou "Accueil critique" (ou "Sortie et accueil") ? En effet, le mot "réception" employé dans ce sens est un mauvais calque du mot anglais reception et se traduit en français correct par "accueil". Je voulais le faire à la main mais il semblerait qu'il y ait plusieurs centaines de cas.

Bonsoir Olyvar, il y a plus de 6 000 pages comprenant un titre de section répondant à ces critères. Au vu du nombre de modifications qui en découlent, pourrait-tu ouvrir une discussion sur la PDD du projet correspondant ? De même, faut-il aussi modifier les sous-sections ? Que faire si, comme sur Dr_House (d · h · j · ), une section Réception a comme sous section Accueil critique ? Par « articles sur le cinéma », cela concerne t-il seulement les films, ou les acteurs seraient par exemples aussi concernés ? Je vois aussi que de nombreuses œuvres littéraires ou auteurs ont ces sections, tel que Jean_Racine (d · h · j · ). Ça devient compliqué :) --Framawiki 9 avril 2018 à 19:25 (CEST)
Je notifie Gregory 14 (d · c) qui semble être l'unique contributeur créant encore régulièrement des articles de cinéma avec une section « Réception » (en regardant les ajouts faits en 2017-2018). Orlodrim (discuter) 9 avril 2018 à 21:14 (CEST)
Notification Gregory 14 :, je vous renotifie, il semblerait que vous êtes passé à côté de la première notification. Lofhi me contacter 26 juin 2018 à 13:32 (CEST)
J'ai compris.Gregory 14 (discuter) 26 juin 2018 à 13:36 (CEST)
Notification Gregory 14 : c'est surtout pour avoir votre avis, en réalité. Mort de rire Lofhi me contacter 26 juin 2018 à 14:12 (CEST)

Suivi de la demande :

Déplacement d'un point final mal placé sur des références de pyramides des âges de communes de France.[modifier le code]

Demande du 24 mars 2018, par : Tractopelle-jaune (discuter) 24 mars 2018 à 08:35 (CET)

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Déplacement d'un point final mal placé sur des références de population de communes de France.

À l'intérieur des modèles {{Pyramide des âges}} et {{Pyramide des âges 2}} (simple redirection vers le premier), utilisés sur certains articles de communes de France, se trouve 2 références vers l'Insee.

Exemple sur : Faveraye-Mâchelles

Avec des réfs du genre :

Pyramide des âges à Faveraye-Mâchelles en 2008 en pourcentage<ref>
{{Lien web 
   |url = http://www.recensement-2007.insee.fr/chiffresCles.action?codeMessage=5&zoneSearchField=MAINE-ET-LOIRE&codeZone=49-DEP&idTheme=3&rechercher=Rechercher
   |titre = Résultats du recensement de la population de Maine-et-Loire en 2008
   |site = le site de l'Insee
   |consulté le = 26 mars 2012.}}</ref>

Serait-il possible de déplacer le point actuellement situé à la fin de la valeur du paramètre consulté le= pour le mettre entre la fin du modèle {{Lien web}} et la balise </ref>, comme ceci : consulté le = 26 mars 2012}}.</ref> ?

À noter que l'indentation du code de la référence varie parfois un peu selon les articles.

Car actuellement, bien que le modèle Lien web trim heureusement correctement ce point mal placé à la fin de la date, il manque par contre à la fin de la référence.

Merci d'avance.

--Tractopelle-jaune (discuter) 24 mars 2018 à 08:35 (CET)

Bonjour, je ne traiterai pas la requête (plus de 8000 utilisations), par contre j'ai une suggestion et une question :
  • suggestion : Merci de remplacer la redirection {{Pyramide des âges 2}} par la même occasion.
  • question : Il y a deux références dans ton exemple, une avec un point final (</ref>.), l'autre sans (</ref>). Il faudrait harmoniser cela, faut-il garder le point final ?
--FDo64 (discuter) 24 mars 2018 à 08:56 (CET)
Honnêtement, j'en sais rien du tout, je notifie le projet Gnome-edit-redo-bw.svg Projet:Communes de France , puisque que c'est à priori un bout de code qui vient de chez eux.
Car moi, j'ai juste vu ce problème lors d'opérations de maintenance, mais je ne contribue habituellement pas sur les communes de France.
--Tractopelle-jaune (discuter) 26 mars 2018 à 09:51 (CEST)
Notification Tractopelle-jaune : bonjour, tu as déjà croisé des pyramides sans les paramètres caption ? Je ne sais pas si je m'occuperai de l'objet initial de la requête, mais je pourrai au moins remplacer Modèle:Pyramide des âges 2 par le premier. Lofhi me contacter 16 mai 2018 à 11:07 (CEST)
Notification Lofhi : D'après les stats d'Orlodrim [2], on a un différentiel de 13 pages (nombre de pages distinctes : 8098 - nombre de pages avec caption non vide : 8085 = 13)
Cela signifie que cela doit être très, très minoritaire.
À noter que ces stats sont pour la page entière, le modèle étant généralement utilisé deux fois sur chaque article.
Mais je n'ai effectivement pas souvenir d'avoir vu un paramètre caption non-rempli. Cela doit concerner que quelques articles.
--Tractopelle-jaune (discuter) 16 mai 2018 à 11:51 (CEST)
Notification FDo64 et Tractopelle-jaune : D'accord, merci pour ce site que j'avais oublié. Je vais essayer de m'en occuper et je vais enlever le point puisque le projet n'a pas répondu (ce qui m'a motivé : Histoire du communisme, un des le plus gros article, les références ont rarement un point final, pour ne pas dire jamais). Par ailleurs, j'en profiterai pour remplacer {{Pyramide des âges 2}}. Lofhi me contacter 19 mai 2018 à 00:43 (CEST)
Bonsoir Tractopelle-jaune, je compte essayer de m'occuper de ta requête et retirer le point du paramètre consulté le, s'il y en a un, des références, pour celles qui sont dans les pyramides. Je vais aussi remplacer la redirection {{Pyramide des âges 2}}. Une quelconque remarque qui pourra m'éviter des surprises ? Lofhi me contacter 8 juin 2018 à 17:27 (CEST)

Suivi de la demande :