Aller au contenu

Discussion Projet:Correction syntaxique/Analyse 559

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Portail de qualité
  • Bon portail
  • Lumière sur
  • À faire
  • Archives
  • Commons

Corrections à ajouter[modifier le code]

Bonjour NicoV Émoticône.

Je travaille sur ce sujet depuis quelques temps et j'ai donc l'occasion de corriger des cas que tu ne sembles pas encore traiter.

Je te donne donc les regex que j'utilise à toutes fins utiles :

  • (ref|/)> *<sup> *(,|;|\.|'|\-|et) *</sup> *(<ref|{{)
  • ref{{,}}ref
  • >{{·}}<ref
  • > *[,'’\-]+ *<ref
  • </ref> *(,|;|\.)+<ref
  • ref> *et *<ref
  • /> *(,|;|\.|'|-|et)+ *<ref
  • > *\[\[,\]\] *<

J'enlève également les séparateurs superflus, sans doute laissés après la suppression d'une référence :

  • ([a-z0-9\]']+) *{{,}} (après un texte)
  • *{{ *, *}} *\. (en fin de ligne)

Remarque : je traite le cas des balises <ref> et également des modèles du type {{sfn}}.

Regex telles que je les ai écrites au fur et à mesure des cas que j'ai rencontré. Donc perfectibles et parfois complémentaires ! Émoticône

Bon courage et n'hésite pas si tu as besoin d'explications ! FDo64 (discuter) 11 juin 2024 à 12:30 (CEST)[répondre]

Salut @FDo64.
Ces regex, c'est pour détecter d'autres cas ou corriger ceux déjà détectés par WPCleaner ? Parce que je ne les vois pas dans ceux détectés (il reste surtout les cas avec un marqueur d'italique/gras casé entre 2 références) NicoV (discuter) 11 juin 2024 à 21:38 (CEST)[répondre]
Notification NicoV : Je n'utilise pas WPCleaner mais AWB, donc ces regex sont pour corriger les cas que je trouve via des recherches du style :
  • insource:/ref\> *(,|;|\.|'|-|et) *\<ref/
  • insource:/ef\> *\<sup/
  • insource:/\/\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/
  • insource:/ef\> *\<sup>\./
  • insource:/\/\> *(,|;|\.|'|-|et) *\<ref/
  • insource:/ref\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/
  • insource:/ef\> *\<sup>,/
Si ça peut t'inspirer pour tes recherches et corrections... --FDo64 (discuter) 11 juin 2024 à 22:27 (CEST)[répondre]
Bonsoir NicoV Émoticône. Comme j'ai découvert un nouveau cas, l'utilisation de « & », je récapitule et simplifie ce qui précède.
L'idée est de détecter et remplacer :
  • les séparateurs *(,|;|\.|'|-|et|&) *
  • présents entre deux références ou modèles de références ({{Sfn}} ou {{Note}})
  • seuls ou encadrés de balises <sup>
Sans oublier les séparateurs superflus (voir premier message).
En espérant que ce soit plus clair... --FDo64 (discuter) 13 juin 2024 à 00:05 (CEST)[répondre]
Salut @FDo64.
J'ai pris en compte les séparateurs et les modèles de références normalement, la liste devrait être mise à jour dans les prochains jours.
Je regarderais plus tard pour les autres suggestions. NicoV (discuter) 13 juin 2024 à 21:17 (CEST)[répondre]
Salut @FDo64. Détection effectuée, on va voir ce qu'il corrige automatiquement. NicoV (discuter) 14 juin 2024 à 19:02 (CEST)[répondre]
Merci NicoV Émoticône. Je vois que dans la liste il y a des mises en italique ou en gras qui sont mal placés, entre deux références. Je suppose que ce sera à corriger manuellement ? --FDo64 (discuter) 14 juin 2024 à 19:18 (CEST)[répondre]
Oui @FDo64, WPCleaner ne sait pas corriger les italiques/gras mal placés. J'y pense, mais jamais trouvé le temps de le faire... NicoV (discuter) 14 juin 2024 à 20:02 (CEST)[répondre]
Autres cas :
  • utilisation du modèle {{'}} au lieu de {{,}}
  • séparateurs bricolés avec des balises <small> (idem <sup>)
--FDo64 (discuter) 14 juin 2024 à 23:06 (CEST)[répondre]
Merci.
J'ai ajouté le modèle, c'est juste de la configuration.
Je regarde pour les balises, un peu plus de boulot... NicoV (discuter) 15 juin 2024 à 11:26 (CEST)[répondre]
Salut @FDo64.
Normalement, c'est bon pour les balises aussi, à vérifier lors de la prochaine analyse de dump, dans environ 1 semaine. NicoV (discuter) 15 juin 2024 à 12:38 (CEST)[répondre]
Salut @FDo64.
La liste a été mise à jour.
J'ai fait une amélioration pour corriger les {{'}}, mon bot est en train de tourner. NicoV (discuter) 23 juin 2024 à 13:34 (CEST)[répondre]
Salut @FDo64.
La liste a été mise à jour et mon bot a traité ce qu'il a pu. Il reste principalement 2 types de problèmes :
  • Les gras/italiques mal positionnés
  • Les références utilisées dans des modèles (mon bot ne les traite pas pour éviter des erreurs dans des modèles comme {{Références}})
NicoV (discuter) 29 juin 2024 à 09:36 (CEST)[répondre]
Merci NicoV Émoticône, je vais les corriger.
Comme je ne sais pas si tu as traité tous les cas que je t'ai signalé, je te liste quelques trouvailles du jour :
Je te laisse regarder et ne les corrige donc pas. --FDo64 (discuter) 1 juillet 2024 à 18:47 (CEST)[répondre]
Bonsoir NicoV Émoticône. J'ai traité la totalité de la liste que tu avais générée le 29 juin.
Avant cela, j'ai corrigé toutes les occurrences que j'ai trouvées de références inclues dans des balises <sup> ou <small>. Plusieurs centaines.
Je vois que dans la liste que tu viens de générer il n'y a pas encore les cas que je t'ai signalé lundi. Je reviendrai donc une fois que tu auras trouvé du temps pour les regarder.
Encore merci ! --FDo64 (discuter) 5 juillet 2024 à 23:19 (CEST)[répondre]
Salut @FDo64.
Pour les balises sup, c'est parce que j'avais pris en compte sub au lieu de sup... ça devrait être traité au prochain passage.
Pour les apostrophes et le "et", ça devrait être traité automatiquement. J'ai l'impression que mon bot n'a pas fini son précédent passage (nouveaux cas détectés, mais pas corrigés et page pas remise à jour), peut-être un redémarrage intempestif sur toolforge : à surveiller sur le prochain passage. NicoV (discuter) 7 juillet 2024 à 16:33 (CEST)[répondre]
Salut @FDo64. Mon bot est passé, la liste s'est réduite à 4 articles. Tu vois encore des cas pas détectés ou pas corrigés ? NicoV (discuter) 8 juillet 2024 à 15:39 (CEST)[répondre]
Merci NicoV Émoticône. Les recherches suivantes trouvent encore quelques pages :
  • insource:/\/\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/ (2 pages)
  • insource:/ref\> *\<sup\> *(,|;|\.|'|-|et) *\<\/sup\> *(\<ref|\{\{)/ (7 pages, dont Zhang Zhijie)
  • insource:/ref\> *(,|;|\.|'|-|et) *\<ref/ (20 pages)
Dans la plupart des cas, ce sont des modifications qui ont été faites après le 1er juillet.
--FDo64 (discuter) 8 juillet 2024 à 23:08 (CEST)[répondre]
Bonsoir @FDo64.
Si elles datent d'après le 1er juillet, c'est normal, la liste est mise à jour à partir du dump du 1er juillet. Par exemple, Zhang Zhijie est détecté et corrigé.
J'ai regardé quelques-unes des pages de la dernière regexp, elles semblent être détectées et corrigées aussi. NicoV (discuter) 10 juillet 2024 à 22:14 (CEST)[répondre]
Merci NicoV Émoticône. C'est parfait, donc je ne reviendrai ici que si je trouve de nouveaux cas.
Pour information, je corrige aussi plein de commentaires mis en dur entre deux références au lieu d'utiliser un modèle de révision. Pas automatisable.
--FDo64 (discuter) 10 juillet 2024 à 22:24 (CEST)[répondre]