Discussion Wikipédia:AutoWikiBrowser/Typos/Archives 2009

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.

À quelle fréquence se font les corrections ?[modifier le code]

Bonjour à tous,
Je souhaitais proposer d'inclure dans la liste des corrections le remplacement de « entre autre » par « entre autres » (bien qu'il puisse exister un petit nombre de cas où le singulier pourrait être voulu et correct, mais un si petit nombre). Mais, si je comprends bien, ou interprète bien, la page Wikipédia:AutoWikiBrowser/Typos, cette correction est déjà prévue. Alors comme on trouve encore un nombre conséquent d'occurrences de l'erreur en question, je viens ici me renseigner : « À quelle fréquence se font les corrections ? », « Faut-il les déclencher par une quelconque procédure ? », « Si oui, laquelle ? », « Ai-je quelque droit de vouloir m'en mêler ? », etc.
Je vous remercie d'éclairer ma lanterne, cordialement, --Wikinade (d) 8 janvier 2009 à 10:59 (CET)

Bonjour
étant donné les risques d'erreur les bots ne doivent en général pas s'occuper des fautes d'orthographe. Les modifications sont donc apportées quand des utilisateurs se servent de l'outils WP:AWB, avec la correction typographique activée. Il n'y a donc pas de fréquence. Mais tu peux t'en mèler en demandant l'autorisation d'utiliser cet outils (attention, en général il est déconseillé de ne faire que de la typo) --Hercule Discuter 8 janvier 2009 à 11:53 (CET)
Tu es redoutable, Hercule ! Tu es donc ici aussi ! Si j'avais su, j'aurais continué la conversation là-bas... Émoticône
Bonjour à toi et meilleurs vœux. Je te rappelle un détail d'importance : Macintosh. Et puis m'en mêler : m'emmêler, oui. Non, non, quelqu'un va très certainement lire ce message et activer son correcteur d'orthographe. Non ?
Alors, si vraiment il ne se passe rien, longtemps, je pourrai toujours... faire une requête sur la page ad hoc Émoticône sourire.
It's a joke ! --Wikinade (d) 8 janvier 2009 à 12:37 (CET)
Je te signale au cas où qu'il est possible de faire tourner un autre système d'exploitation sur ton mac, grâce à VMware ou VirtualPC. Au cas où ;). --Hercule Discuter 8 janvier 2009 à 16:50 (CET)
Je dois encore l'avoir quelque part au fond d'un placard ce VirtualPC, mais il mange beaucoup de mémoire (si la mienne ne m'abuse), et pour être tout à fait honnête l'idée même de voir un bureau Windows s'afficher sur l'écran si chaleureux-esthétique-sympathique de mon fidèle compagnon blanc immaculé me fait frémir : je n'ai pas le cœur de lui imposer ça Tout rouge. Mais merci de ré-attiser si subtilement le feu du gril par tes nouvelles suggestions. --Wikinade (d) 8 janvier 2009 à 17:15 (CET)
P.S.: Pendant qu'on cause, quelqu'un a fait passer le nombre d'occurrences de « entre autre » de 2660 à 2624. Je ferais mieux d'aller l'aider. Émoticône --Wikinade (d) 8 janvier 2009 à 17:15 (CET)

louis-garden (d · c · b) me glisse à l'oreille qu'il n'y a « pas de signe diacritique sur due car aucune confusion n'est possible (a contrario de du et dû). »
Une correction à faire dans la liste ? --Coyau (d) 10 janvier 2009 à 15:31 (CET)

règle gramaticale[modifier le code]

Je voudrais avoir votre idée sur cette règle :

<Typo word="qu'à" find="\b(Q|q)ue (à|aux?)" replace="$1u' $2" />

Crochet.david (d) 15 janvier 2009 à 16:39 (CET)

Pour moi il n'y a pas d'espace entre le quote et le second groupe. Mais je ne pense pas qu'il vaille la peine de s'attarder dessus, je n'en trouve aucune occurrence dans le dernier dump, et il est quand même très peu probable qu'il y en ait à l'avenir ! -- Chico (blabla) 28 janvier 2009 à 01:36 (CET)


{{references}}[modifier le code]

Dans AWB, {{references}} est remplacé par {{Unreferenced|date={{subst:CURRENTMONTHNAME}} {{subst:CURRENTYEAR}}}}, ce qui fait perdre les références et les remplace par un message indiquant ... qu'il n'y en a pas. Voir ce diff, que j'ai dû rétablir ensuite à la main. Je pense sans en être sûr que c'est dû à ces règles RegExTypoFix. Un expert peut-il y jeter un oeil ? Merci. Zetud (d) 18 février 2009 à 23:30 (CET)

Ça m'est déjà arrivé. C'est parced}}, que sur WP:EN, {{references}} redirige vers {{m|unreference alors que sur WP:FR, {{references}} renvoie vers {{références}}. Ce n'est pas une question de typographie, mais bien une question de code. Cordialement, Jimmy psst! le 18 février 2009 à 17:41 (HNE)
Très clair, merci. Zetud (d) 19 février 2009 à 00:04 (CET)
Je crois qu'il faut décocher Replace reference tag dans les Options. Depuis que je l'ai fait je n'ai plus ce problème --Hercule Discuter 19 février 2009 à 23:57 (CET)

Nombres et espaces insécables[modifier le code]

Bonjour! Je découvre l'outil AWB et j'ai remarqué quelques détails :

  • l'expression des millions (100 000 000 par exemple) va modifier pour {{formatnum:100000}} 000
  • le modèle {{Unité}} devrait pouvoir prendre plus en considération le mot qui suit le nombre, car il transforme trop avec le mot magique "formatnum". Exemples de mots (symboles) à considérer : euros, €, francs, dollars, $, albums, copies, livres, habitants, électeurs, étudiants, élèves, personnes, etc.
  • j'ai rencontré l'expression : « 23&nbsp,000 tonnes » et il a modifié pour « {{formatnum:23000}} tonnes » plutôt que {{Unité|23000|tonnes}}
  • quand AWB rencontre des unités du genre : « une superficie de 19,57km{{2}} », il devrait modifier pour {{Unité|19.57|km|2}}
  • j'ai remarqué que AWB veux ajouter un deuxième espace devant les guillemets ( « et " ), et crois que cela arrive particulièrement dans les références.

Bon, j'en suis à mes premiers balbutiements, donc je ne suis pas certain si j'ai tord ou non de rapporter tout ça... Laissez-moi savoir sinon, et bravo pour votre bon travail! Cordialement — Antaya    Fichier:Quebec-Canada.svg 10 avril 2009 à 04:49 (HNE)

Je profite de ta remarque pour signaler également que 2km² est remplacé par {{Unité|2|km}}². Il faudrait corriger pour remplacer par {{Unité|2|km|2}}--Hercule Discuter 10 avril 2009 à 12:18 (CEST)
Je confirme également le deuxième espace devant les guillemets (et ça m'arrive très souvent en dehors des références). Cordialement, Jimmy psst! le 10 avril 2009 à 11:52 (HAE)
Ça semble faire la même chose dans le cas de : , [[Exemple]] (un « [ » après une virgule et une espace). Cordialement, Jimmy psst! le 10 avril 2009 à 12:42 (HAE)

Notez que le modèle {{unité}} a été renommé en {{nombre}} il y a peu. — MetalGearLiquid [m’écrire] 27 juin 2009 à 00:22 (CEST)

Ébauche et portail[modifier le code]

Bonjour, c'est mon premier essai pour des expressions rationnelles, alors quelqu'un peut regarder.

Je rencontre souvent les modèles {{Ébauche}} et {{Portail}}, soit avec des minuscules soit avec l'ancienne syntaxe. (voir Wikipédia:Prise de décision/Bandeaux de portail)

<Typo word="m Ébauche" find="\b{{(é|É)bauche( |\|)?\b" replace="Ébauche|" />
<Typo word="m Portail" find="\b{{(p|P)ortail( |\|)?\b" replace="Portail|" />

Aussi, je croise souvent cette syntaxe anglophone avec 2 "d" ...

<Typo word="adresse" find="\b([rR]é|[aA])dd?resse(s|r)?\b" replace="$1dresse$2" />

En espérant que ce premier essais d'expressions rationnelles soit réussie! Cordialement. — Antaya    Fichier:Quebec-Canada.svg 12 avril 2009 à 19:03 (HNE)

Exposant: volume et surface[modifier le code]

On voit trop souvent des m2 ou des m3 (de même pour km2, km3, mm2, mm3, cm2 ou cm3 et dm3). Serait-il possible d'intégrer de mettre ces puissances en exposant avec AWB? Skiff (d) 5 mai 2009 à 07:47 (CEST)

Je pense qu'il faut les traiter avec deux regexp distinctes:
carrés: \b(G|M|k|K|h|da|d|c|m|u|µ|n|p)m2\b à remplacer par $1m²
cubes: \b(G|M|k|K|h|da|d|c|m|u|µ|n|p)m3\b à remplacer par $1m³
-- LaddΩ parlons! ;) 30 mai 2009 à 02:59 (CEST)
Les caractères que l'on doit utiliser sont les exposants : {{2}} (m2) et {{3}} (m3). Cordialement, Jimmy psst! le 30 mai 2009 à 00:04 (HAE)
Ca donne donc pour les carrés: \b(G|M|k|K|h|da|d|c|m|u|µ|n|p)m2\b à remplacer par $1m2. Je suppose que le K (majuscule) est là pour traiter le problème décrit ci-après. Skiff (d) 30 mai 2009 à 08:37 (CEST)


Pendant que j'y pense, le préfixe kilo est souvent réduit à K alors que cela devrait être k:

Kg->kg

KW->kW

Km->km

KV->kV

Skiff (d) 5 mai 2009 à 13:21 (CEST)

Pour celui-ci il faut replacer \b(?:k|K)(m|W|g|V)\b par k$1. Ça va attraper les Km² et Km³ mais laisser les Km2, Km3. Les exposant ne sont pas perçus comme parties de mots, plutôt comme terminateurs, comme les points et virgules, alors que les chiffres sont vus comme des alphanumériques. Ils seront traités une fois que ce sera un petit exposant. -- LaddΩ parlons! ;) 30 mai 2009 à 02:45 (CEST)
Merci Laddo, pour la syntaxe. Je rajouterai également kA. Skiff (d) 30 mai 2009 à 08:40 (CEST)
Problème toujours pas résolu : si on a "3050 cm{{3}}", AWB transforme en "3050 &Nbsp;cm{{3}}" --M0tty [Plaidoyers et jérémiades] 24 août 2009 à 18:34 (CEST)

Problème avec "Surtout"[modifier le code]

Surtout est transformé en Surtous. Un RegExeur peut-il y jeter un œil ? Zetud (d) 25 mai 2009 à 23:20 (CEST)

Références[modifier le code]

J'ai corrigé quelques Reference(s) en Référence(s) qui proviennent je pense d'un oubli de traduction à partir de la version anglaise. Cette erreur étant relativement courante, je pense qu'il serait souhaitable d'intégrer la correction à AWB. Il y a aussi des versions hybrides Reférence(s) et Réference(s). Skiff (d) 10 juin 2009 à 10:03 (CEST)

Je vois dans la liste :

<Type word="n° non suivi d'un chiffre" find="\b(N|n)°([^0-9][^0-9])" replace="$1{{o}}$2" />

mais ne serait-il pas plus judicieux d’utiliser le modèle {{numéro}} ? — MetalGearLiquid [m’écrire] 27 juin 2009 à 00:24 (CEST)

Il y a deux règles pour Yémen :

Une première qui ratisse large dans la section Toponymie, et une seconde bien moins « puissante » à la lettre Y : <Typo word="Yémen" find="\b(Y|y)(é|e)men\b" replace="Yémen" /> qui à mon avis peut être supprimée (il y a peut-être d’autres cas similaires). — MetalGearLiquid [m’écrire] 27 juin 2009 à 03:00 (CEST)

Armoiries[modifier le code]

La règle actuelle semble déficiente, il faudrait utiliser celle d'Alecs.y (proposée ici) :

<Typo word="armoiries" find="\b(L|l|S|s|C|c)('|on|ette) ?(\[\[)?(a|A)rmoirie(\]\])?\b" replace="$1es $3$4rmoiries$5" />

Cordialement, Louperivois Ψ @ 29 juin 2009 à 22:51 (CEST)

J’ai amélioré la règle dans ce sens ; il faut noter cependant que des corrections d’accord doivent être faites manuellement (p.ex. l’armoirie est → les armoiries sont). —C.P. 6 août 2009 à 17:59 (CEST)

Washington[modifier le code]

Flobel (d) 3 juillet 2009 à 15:38 (CEST)

J'ai remarqué (et souvent fait des corrections) que Washington et souvent écrit Washinton sur Wikipédia. Pensez-vous qu'il faille l'ajouter à ce bot?

Je ne suis pas spécialiste, j'ai remarqué que dans certains documents, la mauvaises orthographe est présente, le bot ne risque-t-il pas de casser les liens?

ZetudBot (en mode semi-automatique) a corrigé ce soir les 6 pages. Trop peu de risques d'erreur pour mettre ça dans les règles. Et pas de liens cassés. Zetud (d) 3 juillet 2009 à 20:53 (CEST)

Bonsoir, je désirais m'assurer que l'AutoWikiBrowser ne corrige pas statuquo ou son pluriel statuquos (orthographes de 1990) en statu quo. Merci d'avance pour votre réponse.--Chrono1084 (d) 23 juillet 2009 à 01:32 (CEST)

J’ai corrigé la ligne qui corrigeait les cacographies de « statu quo », afin que la graphie soudée « statuquo » soit ignorée. —C.P. 6 août 2009 à 15:28 (CEST)
Merci bien.--Chrono1084 (d) 8 août 2009 à 22:02 (CEST)

Scénarios[modifier le code]

Bonjour,

Serait-il possible de lancer une correction sur scénarii (plus de 200 pages concernées, pas top français, voir l'explication sur la page scénario) à remplacer par scénarios ? Attention, il ne faudrait pas que cela change, du coup, l'explication sur la page que je viens de citer, sinon cela n'aurait plus aucun sens ! D'avance merci de votre aide. choumix (d) 23 juillet 2009 à 16:38 (CEST)

Est-ce que la correction a été apportée dans la page de Typos? Si c'est le cas ce sera corrigé manuellement par les utilisateurs de l'outils. --Hercule Discuter 6 août 2009 à 15:55 (CEST)
C'est quoi la page des typos ??? choumix (d) 6 août 2009 à 16:20 (CEST)
Wikipédia:AutoWikiBrowser/Typos :p --Hercule Discuter 6 août 2009 à 16:23 (CEST)
Je viens à l’instant d’ajouter la règle scénarii → scénarios. (On ne corrige cependant pas scenarii sans accent, car c’est une forme savante/précieuse/archaïque/pédante (au choix), mais pas incorrecte.) —C.P. 6 août 2009 à 16:33 (CEST)
Merci ! Et effectivement, scenarii n'est pas à corriger... choumix (d) 6 août 2009 à 21:09 (CEST)

Étoiles → Etoiles[modifier le code]

Est-ce que c'est déjà arrivé à quelqu'un qu'AWB transforme, par exemple, « Match des Étoiles » en « Match des Etoiles »? Ça m'arrive et j'ai beau chercher dans les codes (et dans mes propres « find & replace »), mais je ne vois rien qui pourrait être la cause. Cordialement.  Jimmy   psst!  8 août 2009 à 21:32 (CEST)

AWB et typo française[modifier le code]

J'essaye de faire des regex avec AWB pour Wikisource. Est-ce que quelqu'un peut me donner les lignes de commande pour rajouter un espace devant les signes de ponctuations ;  ?  !. Pyb (d) 14 août 2009 à 16:36 (CEST)

Cela doit ressembler à ceci :
<Typo name="espace" find="([^ ])(;|\?|\!)" replace="$1 $2" />
Melkor73 [blabla] 21 août 2009 à 11:56 (CEST)

Inflation automatique?[modifier le code]

Bonjour, j'ai un pb avec la correction typo des €, serait-il possible de regarder ça?

2 000 euros est remplacé par 2{{Unité|2000|euros}} ce qui donne 22 000 euros...

-- - Zorlot [+d+] 18 août 2009 à 10:21 (CEST)

✔️ C'est fait. J'ai introduit l'erreur lors d'une correction de la regex... Melkor73 [blabla] 18 août 2009 à 10:47 (CEST)
Merci Émoticône.-- - Zorlot [+d+] 18 août 2009 à 10:49 (CEST)

erreur 67 de P:CS[modifier le code]

Pas mal, on est pas loin de la vérité... Émoticône
<Typo word="ref,ref" find="(</ref>|<ref[^/]*/>) *(<sup>)?[\,\;\.]?(</sup>)? *<ref\b" replace="$1{{,}}<ref" />
<Typo word="ref vs ponct" find="(\.+|,|;|:|\!|\?) *(<ref[^>]*>[^<]*</ref>|<ref[^/]*/>)({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?" replace="$2$3$4$5$6$1" />
<Typo word="</ref>.." find="(</ref>|<ref[^/]*/>)\.{2}([^\.])" replace="$1.$2" />
Et avec celles-ci ? Melkor73 [blabla] 24 août 2009 à 15:48 (CEST)
Teste-- - Zorlot [+d+] 24 août 2009 à 15:56 (CEST)
Muuh! Ca a de la gueule! Émoticône-- - Zorlot [+d+] 24 août 2009 à 15:58 (CEST)
\o/ Oh Yeah !! \o/ Émoticône Melkor73 [blabla] 24 août 2009 à 16:04 (CEST)
A toi de la placer...Émoticône-- - Zorlot [+d+] 24 août 2009 à 16:07 (CEST)
Avec joie !!! Émoticône Melkor73 [blabla] 24 août 2009 à 16:13 (CEST)

« J'aurais remplacé (\.+|,|;|:|\!|\?) par (\.|\.{3}|,|;|:|\!|\?) pour tenir compte de 3 points de suspension. »

— Zorlot

J'ai ajouté cela a posteriori Melkor73 [blabla] 24 août 2009 à 16:27 (CEST)
Euh, Houston, on a un problème, je n'ai pas de correction via regex mais, ça marche via "Advanced settings"???! (avec AWB) (oui, j'ai fait la maj! Émoticône)-- - Zorlot [+d+] 24 août 2009 à 16:32 (CEST)
Erf, là je peux pas aider, je n'utilise pas AWB mais WikEd... (AWB ne tourne pas sous mon OS...) Tire la langue Melkor73 [blabla] 24 août 2009 à 16:38 (CEST)
Bon ben je mets là les règles à inclure dan AWB (le temps de trouver la solution à mon pb...:
  1. 
    <?xml version="1.0" encoding="utf-8"?><IRule xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:type="Rule"><enabled_>true</enabled_><Children /><Name>ref,ref</Name><ruletype_>OnWholePage</ruletype_><replace_>(&lt;/ref&gt;|&lt;ref[^/]*/&gt;) *(&lt;sup&gt;)?[\,\;\.]?(&lt;/sup&gt;)? *&lt;ref\b</replace_><with_>$1{{,}}&lt;ref</with_><regex_>true</regex_><regexOptions_>IgnoreCase</regexOptions_><numoftimes_>1</numoftimes_><ifContains_ /><ifNotContains_ /><ifIsRegex_>false</ifIsRegex_><ifRegexOptions_>None</ifRegexOptions_></IRule>
    
  2. 
    <?xml version="1.0" encoding="utf-8"?><IRule xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:type="Rule"><enabled_>true</enabled_><Children /><Name>ref vs ponct</Name><ruletype_>OnWholePage</ruletype_><replace_>(\.+|,|;|:|\!|\?) *(&lt;ref[^&gt;]*&gt;[^&lt;]*&lt;/ref&gt;|&lt;ref[^/]*/&gt;)({{,}}&lt;ref[^&gt;]*&gt;[^&lt;]*&lt;/ref&gt;|{{,}}&lt;ref[^/]*/&gt;)?({{,}}&lt;ref[^&gt;]*&gt;[^&lt;]*&lt;/ref&gt;|{{,}}&lt;ref[^/]*/&gt;)?({{,}}&lt;ref[^&gt;]*&gt;[^&lt;]*&lt;/ref&gt;|{{,}}&lt;ref[^/]*/&gt;)?({{,}}&lt;ref[^&gt;]*&gt;[^&lt;]*&lt;/ref&gt;|{{,}}&lt;ref[^/]*/&gt;)?</replace_><with_>$2$3$4$5$6$1</with_><regex_>true</regex_><regexOptions_>IgnoreCase</regexOptions_><numoftimes_>1</numoftimes_><ifContains_ /><ifNotContains_ /><ifIsRegex_>false</ifIsRegex_><ifRegexOptions_>None</ifRegexOptions_></IRule>
    
  3. 
    <?xml version="1.0" encoding="utf-8"?><IRule xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:type="Rule"><enabled_>true</enabled_><Children /><Name>ref..</Name><ruletype_>OnWholePage</ruletype_><replace_>(&lt;/ref&gt;|&lt;ref[^/]*/&gt;)\.{2}([^\.])</replace_><with_>$1.$2</with_><regex_>true</regex_><regexOptions_>IgnoreCase</regexOptions_><numoftimes_>1</numoftimes_><ifContains_ /><ifNotContains_ /><ifIsRegex_>false</ifIsRegex_><ifRegexOptions_>None</ifRegexOptions_></IRule>
    
-- - Zorlot [+d+] 24 août 2009 à 16:47 (CEST)

Tant qu'on y est...[modifier le code]

Y aurait il moyen d'écrire une regex qui remplace les "exemple" par « exemple », en tenant compte qu'il faut que les guillemets s'ouvrent lorsqu'ils sont suivit d'une lettre, et se ferment lorsqu'ils sont suivit d'un espace ?? j'ai essayé, mais ça outrepasse mes maigres compétences.--M0tty [Plaidoyers et jérémiades] 21 août 2009 à 01:00 (CEST)

J'y avais déjà pensé, mais le problème, c'est que les guillemets anglais sont aussi utilisés dans la syntaxe des tableaux (aide:tableaux), donc on risque de mettre un foutoir incroyable avec une règle sur les guillemets. — Coyau (d) 21 août 2009 à 02:01 (CEST)
Juste, j'avais oublié ce détail... --M0tty [Plaidoyers et jérémiades] 21 août 2009 à 09:18 (CEST)
  1. blabla
  2. blabla
  3. blabla
  4. blabla2
  5. blabla
  6. blabla2

Moyen Âge[modifier le code]

Hello, cette régex est-elle correcte ??

<Typo word="Moyen Âge" find="\b(m|M)oyen( |-)(a|A|â|Â)ge \b" replace="Moyen Âge" />

Cordialement --M0tty [Plaidoyers et jérémiades] 22 août 2009 à 11:00 (CEST)

Moi, je vois un petit espace en trop avant le \b de la fin
<Typo word="Moyen Âge" find="\b(m|M)oyen( |-)(a|A|â|Â)ge\b" replace="Moyen Âge" />
-- - Zorlot [+d+] 22 août 2009 à 12:58 (CEST)

Hello, alors, je cherche à créer une regex qui remplace les A majuscules pas des À majuscules accentués. En effet, avec un français correct, il y a extrêmement peu de cas ou le A est utilisé pour commencer une phrase (ça arrive dans le langage télégraphique), il faut donc changer la logique en systématisant le À sauf les exceptions (mots anglais,...) Seul problème, il faut que la régex détecte que le A est en début de phrase (précédé donc de ". " ou d'un renvoi à la ligne et suivit obligatoirement d'un espace (cela élimine les phrases interrogatives comme A-t-il/elle...). Et là ou je bloque, c'est que je ne sais pas comment représenter le signe "à la ligne"... je ne sais même pas si c'est possible... Merci de votre aide. --M0tty [Plaidoyers et jérémiades] 24 août 2009 à 10:42 (CEST)

Ça doit donner à peu près ça :
<Typo name="À" find="(\n|\. )A " replace="$1À" />
Melkor73 [blabla] 24 août 2009 à 10:48 (CEST)
Formidable, quelle vitesse ! On peut l'appliquer sur la page principale ?? et donc, si je comprend bien, le signe pour symboliser le retour à la ligne est donc "n|" ?? par contre, j'ai l'impression qu'il manque un espace à la fin non : replace="$1À " /> ??--M0tty [Plaidoyers et jérémiades] 24 août 2009 à 10:55 (CEST)
C'est bête, il y a déjà des régex pour ça :
  • <Typo word=". À " find="(\.|\:|\?|!) A " replace="$1 À />
    
  • <Typo word="À " find="^A " replace="À " />
    
  • <Typo word="*À " find="^(\*|#) ?A " replace="$1 À " />
    
Est-ce la même chose ?? --M0tty [Plaidoyers et jérémiades] 24 août 2009 à 10:59 (CEST)
Alors dans l'ordre : le code du retour chariot est "\n", il manquait bien un espace à la fin (bien vu !), et pour les regexs la première fait le job mais sans le retour chariot, et je ne voit pas bien ce que font les 2 suivantes... Melkor73 [blabla] 24 août 2009 à 11:09 (CEST)
Après avoir relu un peu de doc,
<Typo word="À " find="^A " replace="À " />
corrige un "A" en début de ligne, donc après un retour à la la ligne, et
<Typo word="*À " find="^(\*|#) ?A " replace="$1 À " />
effectue la même correction, mais dans les listes et les énumérations (si je ne dis pas de bêtises), donc au final ces 3 règles font déjà ce que tu voulais faire (et même un peu plus...). Melkor73 [blabla] 24 août 2009 à 13:39 (CEST)
Pourtant, ça n'a pas l'air de fonctionner des masses sur AWB... --M0tty [Plaidoyers et jérémiades] 24 août 2009 à 18:16 (CEST)

Après vérification, tout fonctionne, Merci ! --M0tty [Plaidoyers et jérémiades] 24 août 2009 à 18:57 (CEST)

Pour la 3e, ne peut-on pas écrire:
  • <Typo word="*À " find="^(\*+|#+) ?A " replace="$1 À " />
    
pour ne pas se limiter au rang 1?-- - Zorlot [+d+] 25 août 2009 à 22:07 (CEST)
Ça me semble judicieux en effet... Melkor73 [blabla] 25 août 2009 à 22:36 (CEST)
Il y a encore un problème, certains A ne se transforment pas en À, par contre, il arrive que lorsqu'un mot est écrit en majuscule, le A interne s'accentue... Qui sait comment corriger cela ? --M0tty [Plaidoyers et jérémiades] 1 septembre 2009 à 22:19 (CEST)
As-tu des exemples pour nous aider ? Melkor73 [blabla] 1 septembre 2009 à 23:18 (CEST)
Après observation, les A situés en début de paragraphe, juste après un titre constitué de = ne veut pas s'accentuer... pour le reste, il faut que je retrouve des exemples... --M0tty [Plaidoyers et jérémiades] 2 septembre 2009 à 00:04 (CEST)

Bonjour, est-ce qu'il existe une correction de « Aout » en « Août » et « aout » en « août » ? Il me semble que l'utilisation de ^ est l'otho en vigueur -- Cordialement - Archimëa 25 août 2009 à 14:26 (CEST)

Non, il n'y a pas de correction, l'orthographe aout ou Aout (que je trouve horrible, comme beaucoup d'orthographes de la réforme de 1990...) étant acceptée par l'Académie française. Melkor73 [blabla] 25 août 2009 à 15:20 (CEST)
On ne l'accepte pas parce que c'est l'Académie française qui l'accepte, mais plutôt parce qu'aucun consensus ne s'est établi. Ce serait peut-être une bonne idée de faire une PdD sur ce sujet qui est souvent à l'origine de frictions. Personnellement, la première impression que j'ai en voyant « aout », c'est qu'il y a une erreur, mais bon. Tant que la communauté n'aura pas pris de décision claire et précise, les deux orthographes sont acceptées (du moins, on ne peut pas les corriger de façon automatisée). Toutefois, ce n'est pas l'Académie qui dicte à Wikipédia quelles règles adoptées, donc Wikipédia pourrait très bien « bannir » cet orthographe, si une prise de décision se faisait dans ce sens. Cordialement,  Jimmy   psst!  25 août 2009 à 18:54 (CEST)

En tout cas, on peut faire une modification pour tous les mois de l'année, aucun ne prend de majuscule, on écrit donc juin et non Juin (excepté s'il commence la phrase, évidemment...). C'est en anglais que les mois prennent une majuscule. M0tty [Plaidoyers et jérémiades] 25 août 2009 à 19:55 (CEST)

En effet, ce serait très utile vu le nombre d'erreurs dans les articles. Cordialement,  Jimmy   psst!  25 août 2009 à 20:49 (CEST)
Suis trop bête, c'est déjà existant depuis bien longtemps... --M0tty [Plaidoyers et jérémiades] 25 août 2009 à 21:35 (CEST)
Et moi alors? J'appuyais ta proposition! Émoticône  Jimmy   psst!  25 août 2009 à 21:40 (CEST)
J'étais également passé à côté... Émoticône Melkor73 [blabla] 25 août 2009 à 22:02 (CEST)
Il y a des exceptions, comme 14 Juillet quand il s'agit de désigner la fête nationale française par exemple --Hercule Discuter 27 août 2009 à 14:59 (CEST)
En effet, c'est une autre chose à prendre en compte. Bien qu'on devrait tous vérifier avant de valider une modification, je me doute bien que ce n'est pas tout le monde qui se prend cette peine, donc il faudrait être vigilent. Cependant, j'hésite... Vu le grand nombre d'erreurs dans les articles, je crois que cette correction par AWB est pertinente. Doit-on se fier à la vaillance des gens ou prévenir? Cordialement,  Jimmy   psst!  27 août 2009 à 21:54 (CEST)
On pourrait peut-être essayer de remlacer
<Typo word="juillet" find="\b(\d{1,2}) +Juillet\b" replace="$1 juillet" />
par
<Typo word="juillet" find="\b(\d|1[012356789]|2\d|3[01]) +Juillet\b" replace="$1 juillet" />
Melkor73 [blabla] 27 août 2009 à 21:59 (CEST)

Je suis tombé sur quelques "present"(s)... alors, je sais pas s'il y en a beaucoup... utile ?
Un truc comme ca ? :
<Typo word="présent" find="\b(p|P)r[éeè]sent\b" replace="$1résent" />-- Cordialement - Archimëa 27 août 2009 à 12:35 (CEST)

apparament non... -- Cordialement - Archimëa 29 août 2009 à 18:18 (CEST)
Oui, mais attention à ceux qui orthographient mal "pressent"... --M0tty [Plaidoyers et jérémiades] 1 septembre 2009 à 01:33 (CEST)
Donc je peux rajouter ? Il y a aussi "present" en anglais à surveiller. -- Cordialement - Archimëa 1 septembre 2009 à 17:00 (CEST)
Oui, c'est Ok. --M0tty [Plaidoyers et jérémiades] 2 septembre 2009 à 00:09 (CEST)

Majuscule -> minuscule[modifier le code]

Dans wikipédia, beaucoup de grades sont écris avec une majuscule au début alors qu'en français il n'y a pas lieu (en dehors d'un début de phrase). Pourrait-on ajouter dans la correction AWB:

Caporal -> caporal

Sergent -> sergent

Major -> major

Lieutenant -> lieutenant

Capitaine -> capitaine

Commandant -> commandant

Colonel -> colonel

Général -> général

idem pour Président -> président (sauf pour le Président de la République), Premier ministre -> premier ministre et Ministre -> ministre

Skiff (d) 1 septembre 2009 à 16:35 (CEST)

Euh, la page Premier ministre utilise la majuscule dès l'introduction et dans le corps du texte. Quels sont les références en la matière ? --Hercule Discuter 1 septembre 2009 à 16:48 (CEST)
Je me suis un peu enflammé sur la fin cf [1] Skiff (d) 1 septembre 2009 à 18:47 (CEST)

Problèmes[modifier le code]

Je remarque plusieurs problèmes :

En utilisant les régex sur wikEd
  • Le terme méditerranéenne est transformé en "Méditerranéeenne.
  • Si une URL contient les caractères 3A, par exemple, il va les transformer en 3 A... ce qui casse le lien.

(les espaces sont de moi) :

Le troupeau comprend au total 1& nbsp;254& nbsp;000 têtes, dont 856 000 chèvres. 

est transformé en :

Le troupeau comprend au total 1& nbsp;254& nbsp;{{Unité|000 |t}}êtes, dont 856 000 chèvres.

les espaces insécables ne sont pas détectés, et

  • Il ne détecte pas deux & nbsp;& nbsp; d'affilée (les espaces sont de moi), et ne les corrige donc pas.
    • pour les 2 cas précédent, même le bouton de changement du html en code wiki est inefficace.
Sur AWB
  • Les grands nombres, supérieurs à 6 chiffres, sont parfois (étrangement, ce n'est pas systématique) mal transformés en {{formatnum}} : Exemple : 26 000 000 est transformé en 26 26 {{formatnum:000000}}, problème qui ne se pose pas sous wikEd...
  • Alors que contrairement à wiked, 1& nbsp;254& nbsp;000 (les espaces sont de moi) se transforme bien en {{formatnum:1254000}}.

Quelqu'un peut-il voir d'où proviennent les problèmes ? Cordialement --M0tty [Plaidoyers et jérémiades] 3 septembre 2009 à 23:35 (CEST)

Pour cette erreur :
Le troupeau comprend au total 1& nbsp;254& nbsp;{{Unité|000 |t}}êtes, dont 856 000 chèvres.
il y a 2 problèmes distincts :
  • wikEd semblent ne pas reconnaitre la chaîne & nbsp;, je ne sais pas trop pourquoi, et a fortiori lorsqu'elle est mal tapée (espace) [Edit:je viens de comprendre pourquoi tu ajoutais des espaces... Émoticône];
  • wikEd a du mal avec les caractères accentués : voir ici et ici, ce qui fait que le t est reconnu comme un mot entier et donc symbole de la tonne... ;
Ensuite, il n'y pas de règle pour corriger plusieurs espaces insécables consécutives.
Pour le reste je ne sais pas...
Melkor73 [blabla] 4 septembre 2009 à 10:43 (CEST)

C'est dans l'air ! ^^[modifier le code]

Pour remplacer aerologie et meteorologie :

<Typo word="météorologie" find="\b(m|M)[eèéêë]t[eèéêë]orologi(e?|ste?|que?)(s?)\b" replace="$1étéorologi$2$3" />

<Typo word="aérologie" find="\b(a|A)[eèéêë]rologi(e?|que?)(s?)\b" replace="$1érologi$2$3" />

Interressant ? -- Cordialement - Archimëa 5 septembre 2009 à 19:07 (CEST)

Oui, je pense qu'on peut le mettre... --M0tty [Plaidoyers et jérémiades] 7 septembre 2009 à 20:00 (CEST)

Pleins de problèmes[modifier le code]

Après utilisation de AWB et des RegEx disponibles sur WikEd, on me signale de nombreuses erreurs :

Sont-ce bien les mêmes RegEx utilisées pour AWB et WikEd ? Il me semble que celle pour WikEd sont transformée en JS non ? Ou puis-je m'adresser dans ce cas pour corriger ces erreurs ? --M0tty [Plaidoyers et jérémiades] 7 septembre 2009 à 20:00 (CEST)

Je viens d'avoir ce problème... -- Cordialement - Archimëa 12 septembre 2009 à 22:02 (CEST)
Salut, Richard, je pense que ta regex sur les ISBN s'applique après celles sur les formatnum d'ou le résultat (si c'est bien ça ton problème...)-- - Zorlot [+d+] 12 septembre 2009 à 22:24 (CEST)
Hum oui, mais c'est normal puisque j'utilisais pas la regex que je suis en train de préparer... c'est la regex formatnum... qui a repéré cet isbn avec espace et qui l'a pris pour un simple chiffre... -- Cordialement - Archimëa 12 septembre 2009 à 23:23 (CEST)

Proposition d'une RegEx[modifier le code]

<typo word="</ref>,<ref" find="(</ref>|<ref[^/]*/>)<ref" replace="$1,<ref"

Cette Regex est-elle valide ?? elle permet de séparer deux références par un {{,}}. Elle n'existe pas encore. QU'en pensez vous ?? --M0tty [Plaidoyers et jérémiades] 9 septembre 2009 à 17:14 (CEST)

MMuuh, il y a celle là
<Typo word="ref,ref" find="(</ref>|<ref[^/]*/>) *(<sup>)?[\,\;\.]?(</sup>)? *<ref\b" replace="$1{{,}}<ref" />
qui est déjà en place et qui devrait faire l'affaire!?-- - Zorlot [+d+] 9 septembre 2009 à 17:29 (CEST)
Non, elle ne remplace que dans le cas ou il y a des <sup>, ma proposition permettrait de mettre systématiquement une {{,}} lorsque 2 références sont accolées... --M0tty [Plaidoyers et jérémiades] 9 septembre 2009 à 17:51 (CEST)
Non, les sup sont en option ainsi que les espaces, points, virgules...! (ça ne fonctionne pas?)-- - Zorlot [+d+] 9 septembre 2009 à 18:00 (CEST)
Non, ça ne fonctionne pas, y a un paquet de Régex qui ne fonctionnent pas en fait... Émoticône, ou une fois sur deux, c'est très étrange... --M0tty [Plaidoyers et jérémiades] 9 septembre 2009 à 18:12 (CEST)
Tu utilise AWB? moi, je confirme que ça ne marche pas si je me limite à charger les regex, en revanche si je les mets en "normal" ou "Avenced setting", la regex fonctionne bien! Donc, je suis d'accord pour dire que nous avons un problème de maj des regex (du moins sur AWB) Mais, moi, je sais pas comment corriger ça!-- - Zorlot [+d+] 9 septembre 2009 à 18:18 (CEST)
Tu as transféré toutes les régex de cette page sur awb ?? pour ma part, je supplée celles qui ne vont pas en les corrigeant via le "normal" (je ne comprend pas les "advanced settings") mais ce n'est pas toujours suffisent pour faire du bon travail. --M0tty [Plaidoyers et jérémiades] 9 septembre 2009 à 18:27 (CEST)

recueil - recueillir - cueillir[modifier le code]

Bonjour, je propose (une quarantaine d'erreurs actuellement) :

  • <Typo word="recueil" find="\b(r|R)ecc?(?:eu|ue)il(s?)\b" replace="$1ecueil$2" />
  • <Typo word="recueillir" find="\b(r|R)ecc?(?:eu|ue)ill?([aeiîo])" replace="$1ecueill$2" />
  • <Typo word="cueillir" find="\b(c|C)euill([aeiîo])" replace="$1ueill$2" />

et aussi supprimer Inaccueillir dans <Typo word="accueillir" find="\b([aA]|[iI]na)cc?(?:eu|ue)ill?([aeiîo])" replace="$1ccueill$2" />
Cordialement - Drongou (d) 9 septembre 2009 à 22:37 (CEST)

Pour franciser et remplacer en icon, de icon, ou fr icon, es icon etc... vers {{en}} etc... ?

<Typo word="Icon" find="{{([a-z]{2}) icon}}" replace="{{$1}}" />

-- Cordialement - Archimëa 10 septembre 2009 à 22:38 (CEST)

C'est pas utile Émoticône -- Cordialement - Archimëa 19 septembre 2009 à 18:39 (CEST)

Bonjour. Merci de transformer les CO2 en CO2, S02 en SO2... Je ne sais pas faire. domsau2 (d) 15 septembre 2009 à 09:27 (CEST)

Je propose
<Typo word="CO2" find="\b[Cc][Oo] *[2²]" replace="CO<sub>2</sub>" />
<Typo word="SO2" find="\b[Ss][Oo] *[2²]" replace="SO<sub>2</sub>" />
Quelqu'un y voit-il une source d'erreurs/faux positifs ? Melkor73 [blabla] 15 septembre 2009 à 10:36 (CEST)
Tant qu'à faire rajouter deux des éléments les plus communs: H2O, O2. Skiff (d) 15 septembre 2009 à 10:48 (CEST)
NH4, SO3 ... etc -- Cordialement - Archimëa 15 septembre 2009 à 11:28 (CEST)
Effectivement, il y en a quelques uns avec des modèles prévus Catégorie:Modèle formule chimique donc:
CO2
<Typo word="CO2" find="\b[Cc][Oo] *[2²]" replace="{{CO2}}" />
,etc.-- - Zorlot [+d+] 15 septembre 2009 à 11:52 (CEST)
Mouais, mais pour le coup, veut-on ajouter des liens partout ? Melkor73 [blabla] 15 septembre 2009 à 12:49 (CEST)
Effectivement... il y a aussi {{Ind}} de dispo CO{{Ind|2}} => CO2 -- - Zorlot [+d+] 15 septembre 2009 à 15:00 (CEST)
Ça a l'air pas mal. Par contre du coup, il va falloir faire attention à ne pas péter les modèles {{CO2}} etc. Melkor73 [blabla] 15 septembre 2009 à 15:33 (CEST)
Je croyais que les regex ne s'appliquaient pas dans les modèles!? -- - Zorlot [+d+] 15 septembre 2009 à 15:36 (CEST)
Elles s'appliquent partout... Malheureusement... --M0tty [Plaidoyers et jérémiades] 15 septembre 2009 à 17:11 (CEST)

Modèle ISBN[modifier le code]

Bonjour, j'ai créé ca pour mettre en place le modèle ISBN.
Ces regex ne corrigent pas les ISBN erroné ! (soyons clair, ni le placement des tirets... ni le temps pour demain Émoticône)

  1. Apposition du modèle {{ISBN}} ;
  2. Suppression des small ou parenthèses que l'on retrouve souvent ;
  3. Gestion des doubles ISBN.

Voici une page de test... Je l'ai testé en live maintenant sur près de 1000 articles et tout ce passe bien...

<Typo word="ISBN" find="(?<!(= *))[iI]\.?[sS]\.?[bB]\.?[nN]\.? ?-? ?(10|13)? ?:? ?([0-9]{1,3})?(\.|-| +)?([0-9]{1,7})(\.|-| +)?([0-9]{1,7})(\.|-| +)?([0-9]{1,7})(\.|-| +)?([0-9]|[xX])" replace="{{ISBN|$3$4$5$6$7$8$9$10$11}}" />
<Typo word="ISBN" find="(\[{1,2}|<[sS][mM][aA][lL][lL]>\(|\(<[sS][mM][aA][lL][lL]>|<[sS][mM][aA][lL][lL]>|\() *({{ISBN\|[^}]+}}) *(\)</[sS][mM][aA][lL][lL]>|</[sS][mM][aA][lL][lL]>\)|</[sS][mM][aA][lL][lL]>|\)|\]{1,2})" replace="$2" />
<Typo word="ISBN" find="([^}]+)(}})(,|;|\.| )? *(et|o[uù]|corr?ig[eéèêë]|puis|/|\\|;|,|\+)? *{{ISBN" replace="$1" />

Plutôt que de l'appliquer tous seul dans mon coin, j'aurais voulu le rajouter à la liste...

Qu'en pensez-vous ? -- Cordialement - Archimëa 17 septembre 2009 à 18:38 (CEST)

Bonne idée... T'as un robot pour tester aussi vite et sur autant de page à la fois O.o ??? --M0tty [Plaidoyers et jérémiades] 17 septembre 2009 à 18:44 (CEST)
Non, je n'ai pas de bot, malheureusement... En plusieurs jours et avec AWB, c'est vraiment pas difficile... après c'est une question d'habitude (et de temps)...
J'ai oublié de préciser qu'il ne s'installe pas après = ou =(espace) pour éviter notamment les modèles Ouvrage (et cite book) ainsi que les infobox. Etant donné que le modèle rajoute des parenthèse il est pas toujours pertinent, notamment les tableaux (ou les infobox...) -- Cordialement - Archimëa 17 septembre 2009 à 20:21 (CEST)
Je viens de rajouter les regex à la page, en espérant que ca convienne à tous le monde... (Merci à Zorlot et Hercule pour l'aide en passant...) -- Cordialement - Archimëa 19 septembre 2009 à 18:30 (CEST)

Est-ce qu'il y a un moyens ou est-ce utile de gérer ceci. Il n'y en a peut-être pas beaucoup... mais il me semble qu'avant des guillemets, : ou ; ce n'est pas un thin space qu'il faut... L'utilisation dans certains cas sur mon exemple est bien douteux ! (notamment accolé aux parenthèses...).

Quelle est l'utilisation précise de &thinsp; ? -- Cordialement - Archimëa 23 septembre 2009 à 15:55 (CEST)

Les espaces insécables sont gérés automatiquement par le logiciel médiawiki, il ne faut donc rien utiliser pour créer des espaces insécables à part un espace normal. Toutes ces "formules" sont donc à remplacer pas de simples espaces. --M0tty [Plaidoyers et jérémiades] 24 septembre 2009 à 00:14 (CEST)

✔️ qu'aeiou[modifier le code]

ça marcherait çà? :

<Typo word="qu+voyelle" find="\b([Qq])ue ([AEIOUaeéèêiou])" replace="$1u'$2" />
<Typo word="qu+h+voyelle" find="\b([Qq])ue ([Hh][AEIOUaeéèêiou])" replace="$1u'$2" />
-- - Zorlot [+d+] 24 septembre 2009 à 03:37 (CEST)
Aucune opposition, pas un ptit exemple pour refuser...Émoticône je peux donc les introduire dans la liste?-- - Zorlot [+d+] 8 octobre 2009 à 00:32 (CEST)
Fais toi plaisir... --M0tty [Plaidoyers et jérémiades] 8 octobre 2009 à 21:48 (CEST)
J'allais oublier!-- - Zorlot [+d+] 10 octobre 2009 à 03:39 (CEST)

Reçevoir[modifier le code]

Pour répondre à la demande sur la guilde des guildes. Il y a apparament que 41 positifs... mais ca peut servir...

<Typo word="Recevoir" find="\b([Rr])e[cç]evoir\b" replace="$1ecevoir" />

-- Cordialement - Archimëa 24 septembre 2009 à 20:35 (CEST)

Avec une recherche sur WP via google, on trouve des positifs.
Il y a déjà une regex pour changer recu en reçu... alors celle-ci pourrait compléter... -- Cordialement - Archimëa 26 septembre 2009 à 23:54 (CEST)

Abus des modèles[modifier le code]

J'utilise beaucoup AWB pour des corrections orthographiques simples, et je profite aussi des règles standard en cochant Enable RegexTypoFix. Mais j'avoue que je suis de plus en plus las des multiples corrections que ces règles standards « apportent », en mettant de partout des modèles {{unité}}, {{numéro}}, {{p.}}, voire {{formatnum}} , ou en remplaçant les </br> non standards.
Outre la surcharge que peut représenter cet abus de modèle (conséquences possibles expliquées là, et outre la surcharge des diff, cela complique la syntaxe wiki pour les débutants et, j'en suis persuadé, ne les incite pas à participer. Pour en avoir parlé ça et là, je sais que je ne suis pas le seul à penser ça.
D'où mon interrogation : n'y a-t-il pas un moyen de modifier ces Regex, pour éviter de les mettre trop systématiquement ? Par exemple pour {{p.}} ou {{unité}}, ne pas mettre le modèle quand il change pas le rendu ? (le seul intérêt est l'espace insécable ?)
Ma lassitude, quand elle devient exaspération, me fait même reverter certaines de ces modifications proposées par AWB, et je pense que, si un Regexeur plus expert que moi retravaillait quelques Regex dans ce sens, Wikipédia (et moi) y gagnerait. Votre avis ? Zetud (d) 7 octobre 2009 à 23:28 (CEST) Zetud (d) 7 octobre 2009 à 23:28 (CEST)

Je ne crois pas que les modèles ci-haut soit abusifs, puisqu'il apportent réellement la bonne typographie. Un modèle abusif est plutôt, selon moi, le modèle {{guil}} qui est complètement inutile puisque le système de WP convertit automatiquement les espaces des guillemets en espaces insécables. On a également fait attention de ne pas utiliser le modèle {{Unité}} abusivement et systématiquement, comme dans le cas des % où il est inutile de l'utiliser (puisque l'espace insécable est formatée automatiquement par le système de WP). Cordialement,  Jimmy   psst!  8 octobre 2009 à 00:25 (CEST)
Pour moi, les modèles véritablement abusifs sont ceux utilisés pour les références bibliographiques, qu'il est possible de formater correctement sans utiliser dix lignes de code (quand y en a qu'une, ça va, mais sur un article avec une centaine de références comme cela, c'est effrayant même pour le contributeur expérimenté). Ahbon? (d) 21 décembre 2009 à 18:09 (CET)

Bonjour,

Je recopie ici une requête sur Wikipédia:Bot/Requêtes refusée car devant être demandé ici :

Demande du 21 octobre 2009, par : tpa2067(Allô...) 21 octobre 2009 à 11:08 (CEST)

Références ou discussions/décisions justifiant la demande :
voir par ex Wikipédia:Le_Bistro/21_octobre_2009#Offre_de_lecture

Nature de la demande :
remplacement des "oe" fautifs par des "œ" corrects. Exemples sur wp :

sans compter toutes ces formes au pluriel fautives.

il existe de nombreuses formes "oe" correctes en français donc un traitement global des "oe" est impossible.

merci d'avance

J'ai aussi :
Agrafian (me parler) 21 octobre 2009 à 11:46 (CEST)
Mais encore : noeud, voeu, choeur, manoeuvre. Agrafian (me parler) 21 octobre 2009 à 12:20 (CEST)

ceuil vs cueil[modifier le code]

retranscrit de Wikipédia:Le_Bistro#Offre_de_lecture

Il a aussi le cas des "ceuil" pour "cueil" (accueil, recueil, etc. et tous les verbes dérivés avec toutes leurs formes conjuguées) Je viens de corriger à la main 22 acceuillir. Il me semble qu'il n'y a pas de mots français contenant la séquence "ceuil" donc un bot pourrait y aller de bon cœur parce que 22+ 22 receuil (j'ai même trouvé un "receuill"! - ✔️ corrigé-)+ w + x + y + z + ..., ça fait bcp à la fin. --tpa2067(Allô...) 21 octobre 2009 à 12:11 (CEST) PS: + cercueil

Demande spéciale pour la catégorie:isomérie[modifier le code]

les 300 articles de la catégorie:isomérie du Projet:Chimie commencent tous actuellement par les 2 lignes :

{{Titre mis en forme|C<sub>3</sub>H<sub>4</sub>Cl<sub>2</sub>}}
{{isomérie|C=3|H=4|Cl=2}}

(avec les formules chimiques bien sûr variables) qui font apparaître un horrible saut de ligne entre le titre et la première phrase

Or quand ces 2 lignes sont mises sous forme d'une seule :

{{Titre mis en forme|C<sub>3</sub>H<sub>4</sub>Cl<sub>2</sub>}}{{isomérie|C=3|H=4|Cl=2}}

plus de saut de ligne!

Il faudrait un Typo genre <Typo word="isomérie" find="}}+retour ligne+{{isomérie|" replace="}}{{isomérie|" /> à ne faire travailler que sur cette catégorie. Merci d'avance. --tpa2067(Allô...) 23 octobre 2009 à 19:34 (CEST)

PS: ref= Discussion_Projet:Chimie#Mise_en_page_des_isoméries

Assertions arrières de tailles variables[modifier le code]

Bonjour à tous !

Je suis tombé sur trois expressions régulières qui me posaient problèmes :

<Typo word="ISBN" find="(?<!(= *))[iI]\.?[sS]\.?[bB]\.?[nN]\.? ?-? ?(10|13)? ?:? ?([0-9]{1,3})?(\.|-| +)?([0-9]{1,7})(\.|-| +)?([0-9]{1,7})(\.|-| +)?([0-9]{1,7})(\.|-| +)?([0-9]|[xX])" replace="{{ISBN|$3$4$5$6$7$8$9$10$11}}" />
<Typo word="exemple" find="\b(?<!(?:[fF]or|[aA]n)\s+)(e|E)xample(s?)\b" replace="$1xemple$2" />
<Typo word="tous les" find="\b(?<!(?:[eE]n|[aA]vant)\s+)(T|t)out les\b" replace="$1ous les" />

Ces trois regex utilisent en effet des assertions arrières qui ne sont pas de tailles fixes (et qui sont mêmes potentiellement de taille infini). Comment peuvent-elles fonctionner ? AWB utilise-t-il un moteur qui gère les répétitions infini à l'intérieur de ces assertions ? Ne peut-on pas réfléchir à des regex de remplacement qui fonctionnerait de partout - et notamment, dans mon cas, avec PCRE 7.9 avec PHP 5.3.0 ?

Bref, je m'interroge Émoticône sourire !
Cordialement,
--bvs-aca (d) 3 novembre 2009 à 18:39 (CET)

J'ai un problème avec les espaces insécables : AWB insère des & nbsp; (l'espace est de moi pour casser le code...) à la place des modèles {{nombre|XX|YY}} qu'il n'utilise même pas... Quelqu'un à une solution ? --M0tty [Plaidoyers et jérémiades] 15 novembre 2009 à 14:15 (CET)

Regex pour exclure une chaine de caractère[modifier le code]

ZetudBot (d · c · b) aimerait trouver les "La ville est fondé" sauf quand cette expression est précédée de "de". Sur cette page, le but de de retenir les cas marqués "à modifier", et d'exclure les 3 cas "à ne pas modifier", surtout le dernier.
Tout ce que j'essaye autour de     ^(de) la ville est fondé\b     ne marche pas... Une idée ? Zetud (d) 8 décembre 2009 à 00:20 (CET) PS. Soyez rassurés, cette modification d'orthographe, si elle marche, ne passera jamais en automatique, mais en semi-manuel. Zetud (d) 8 décembre 2009 à 00:20 (CET)

L'opérateur d'inversion ^ ne peut être utilisé qu'au sein d'une classe comme [^ab] ce qui inverse son sens, ainsi [^ab] matche tout caractère différent de a et b. -- Chico (blabla) 8 décembre 2009 à 10:27 (CET)
Et donc aucun moyen d'exclure une chaine de caractères comme "de" ? J'ai essayé plusieurs syntaxes, celle proposée plus haut et aucune autre ne marche, mais je me dis qu'il doit bien exister une solution ... Zetud (d) 8 décembre 2009 à 11:16 (CET)
Salut !
Renseigne-toi sur les assertions. Et surtout, évidemment, fait des tests pour être sûr d'en avoir bien compris le fonctionnement.
Cordialement,
--bvs-aca (d) 9 décembre 2009 à 18:34 (CET)
Assertions ? Je ne vois pas ce que c'est ... Le dernier test :    [^\(de\)] la ville est fondé   est toujours à côté .... Zetud (d) 15 décembre 2009 à 00:28 (CET)
Ca marche !    (?<!de )la ville est fondé     est la syntaxe qui remplit le besoin, tous les tests OK sur ma page de test. Zetud (d) 15 décembre 2009 à 23:57 (CET)

des états d'âme, un Etat, un coup d'Etat[modifier le code]

Je ne sais si cette erreur peut être corrigée automatiquement, mais un très grand nombre de Wikipédiens écrivent Etat & coup d'Etat avec une minuscule (je crois savoir que Wikipédia préfère en plus mettre des accents sur les majuscules, ce qui n'est en principe pas obligatoire selon l'Académie; dans ce cas, il faut écrire État & coup d'État). Vu les possibilités de confondre avec "états d'âme" ou "état de choc" ou tout autre cas où "état" ne se réfère pas à l'institution étatique, je ne sais s'il est possible de corriger automatiquement cette faute vue à peu près une centaine de fois, mais il devrait sûrement être possible de changer "coup d'état" en "coup d'Etat" automatiquement)... Cordialement, Ahbon? (d) 21 décembre 2009 à 18:07 (CET)

PS: attention, il ne faudrait pas créer un wikilien automatique vers "coup d'Etat", bon nombre d'articles devant être liés vers des coups d'Etat spécifiques. Ahbon? (d) 21 décembre 2009 à 18:11 (CET)

Pour l'Académie, l'accentuation des majuscule est obligatoire. Bien sûr que cette correction est possible. Je m'y attelle (vers coup d'État bien sûr), et idem sur homme d'état. Zetud (d) 21 décembre 2009 à 18:31 (CET)
L'accent a pleine valeur orthographique, autant en minuscule qu'en majuscule. D'ailleurs, pourquoi ne pas mettre les accents sur les majuscules en Europe? Je n'ai jamais compris... Au Québec, on ne se pose même pas la question et on les met de façon systématique. Émoticône Cordialement,  Jimmy   psst!  21 décembre 2009 à 22:22 (CET)
J'avais pourtant juré déjà avoir lu sur l'Académie qu'ils n'étaient pas obligatoires ;-) Aurais-je halluciné, ou les règles académiques seraient-elles elles-mêmes "flottantes"? En tout état de cause, merci pour avoir corrigé par bot en si peu de temps cette erreur, j'en vois déjà les effets ! Pour l'écriture manuelle, j'ai eu des professeurs de français qui m'ont assuré que les accents sur les majuscules étaient facultatifs. Je crois que ça vient du fait de l'écriture en attachée (écriture cursive) enseignée, qui, si elle rend possible les accents sur les majuscules, les rends peu esthétiques (l'accent se plaçant normalement sur une ligne du papier inférieure à celle du haut de la majuscule. Pour l'écriture sur clavier, je crois qu'il s'agit d'une convention typographique: il semble qu'il était impossible d'utiliser des majuscules accentuées sur une machine à écrire, quant à l'ordinateur, personnellement, j'ai déjà assez de corrections à faire quand j'écris deux cents pages Word pour ne pas m'embêter avec les majuscules accentuées). Ahbon? (d) 21 décembre 2009 à 22:38 (CET)
icône « fait » Fait. Une passe de Bot en mode automatique en excluant les liens/références/images/modèles, puis une passe de Bot en semi-automatique sur ces liens/références/images/modèles (qui aura nécessité plusieurs interventions manuelles pour les faux-positifs : mot anglais, titre, orthographe originale, correction de liens, création de redirection, etc.). Zetud (d) 22 décembre 2009 à 00:38 (CET).
Puis dernière passe de traitement des pluriels. Environ 1 500 corrections au total. En pratique, cette requête aurait plus sa place ici : WP:RBOT. ZetudBot (d) 22 décembre 2009 à 09:22 (CET)
Clavier québécois
Clavier français

D'accord, je crois comprendre que vos claviers ne sont pas les mêmes qu'au Québec. Par ici, on utilise une version adaptée et normalisée du clavier QWERTY (et on a des touches pour les accents très faciles à utiliser). Pour nous, ce n'est pas une corvée de les mettre. Émoticône Cordialement,  Jimmy   psst!  22 décembre 2009 à 18:45 (CET)

aédrique pour aèdrique[modifier le code]

Demande du 22 décembre 2009, par : tpa2067(Allô...) 22 décembre 2009 à 06:00 (CET)

Suite à cette section concernant tétraédrane et dodécaédrane, ci-dessus, Il y a aussi bcp de fautes dans les adjectifs issus de polyèdres. J'ai déjà rectifié tous les "tétraèdrique" par la forme correcte "tétraédrique" ainsi que tous les "dodécaèdrique" mais en fait, il y a une infinité (?) de tels adjectifs :

  • polyédrique
  • octaédrique
  • hexaédrique
  • icosaédrique
  • cuboctaèdrique
  • triédrique
  • hémiédrique
  • heptaédrique
  • holoédrique
  • isoédrique
  • rhomboédrique
  • etc.

en fait, il y a aussi métrique, antisy-, sy-, milli-, déci-, kilo-, etc. donc il serait certainement plus rapide et surtout plus exhaustif de faire : voir ci dessous


Nature de la demande :
trouver la séquence "è*rique" et la remplacer par "é*rique", *=T ou D et il n'y a qu'un autre différent, d'après mon Robert en 9 vol., "algébrique", 10 fois mal orthographié avec un accent grave d'après le recherche interne.

Il semble qu'il y ait plusieurs titres d'articles/modèles utilisant le « è » (cf. Composé polyèdrique), les gens des projets concernés sont au courant? --VanBrooken (d) 30 décembre 2009 à 15:58 (CET)
Corrections à intégrer à WP:AWB/T --Hercule Discuter 13 janvier 2010 à 11:08 (CET)