Discussion utilisateur:ZiziBot

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Cette page est dédiée à toutes les discussions concernant le robot (bugs et suggestions). Pour rapporter une anomalie du robot, merci de mentionner le nom de l'article (diff). Le bot répond parfois. Vous pouvez aussi donner votre avis sur le sondage du bot. Stop Le bot arrête ses éditions en mettant {{stop}} ou STOP dans votre message (n'hésitez pas en cas de bug!).

Fichier audio
Musique 8 bit préférée du robot
Des difficultés à utiliser ces médias ?
Des difficultés à utiliser ces médias ?

Anciennes discussions : ici

Fait Modifs[modifier le code]

Bonjour, je vois passer dans ma lds des modifs où zizibot modifie des références bibliographiques en transformant |prénom=Jean |nom=Dupont par |auteur1=Jean Dupont ; il vaudrait mieux éviter. Outre que ça ne sert à rien, c'est susceptible de poser potentiellement problème avec les appels à la bibliographie notamment à l'aide de {{sfn}}. Cordialement Ypirétis (discuter) 26 octobre 2019 à 14:47 (CEST)

Autre chose. Sur Sahem al-Joulane, il transforme auteur=Rami Arav, Richard A. Freund en auteur1=Rami Arav, Richard A. Freund, ce qui est toujours incorrect. Tant qu'à faire il faudrait qu'il soit capable de créer auteur1 et auteur2, sinon pas la peine d'y toucher si c'est trop compliqué pour lui. Cordialement Ypirétis (discuter) 26 octobre 2019 à 15:04 (CEST)
1) L'ancrage sfn est correctement géré avec « auteur1=Jean Dupont ». Voir documentation. Le bot ne converti pas les cas où ça casse. La distinction prénom/nom vient d'une époque où ça marchait pas.
2) Le traitement prénom/nom va être désactivé.
-- Irønie (discuter) 26 octobre 2019 à 15:30 (CEST)
Bon... S'il sait ne pas se mélanger les pinceaux avec des auteurs écrits comme Jean Paul David (sans tiret). Mais, quand même, si c'est écrit nom + prénom, ça marche tout le temps, pourquoi y toucher ? Cordialement Ypirétis (discuter) 26 octobre 2019 à 17:53 (CEST)
Fait corrections effectuées. Module de distinction auteur ajouté. — irønie

passage[modifier le code]

Bonjour,

Serait-il possible d'éviter l'ajout de passage= dans les réfs bibliographiques? Typiquement, un ouvrage placé en biblio sera mentionné à plusieurs reprises dans l'article, et avec différents passages, contrairement à une citation ponctuelle qui ne fera pas forcément l'objet d'un placement en bibliographie.

Cordialement, --Frédéric-FR (discuter) 29 octobre 2019 à 13:19 (CET)

Notification Frédéric-FR : : Oui, retiré (v0.15). J'ai lancé une discussion sur paramètres vides. -- Irønie (discuter) 29 octobre 2019 à 13:43 (CET)
Bonjour Irønie. À ce propos, ne crois-tu pas qu'il soit maintenant justifié de demander un botflag ? Même si les contributions sont peu fréquentes, elles sont automatisées - si je comprends bien. SammyDay (discuter) 12 novembre 2019 à 15:54 (CET)
Notification Sammyday : Demande en cours depuis 15 jours : Wikipédia:Bot/Statut#ZiziBot, ça va pas tarder. Les passages récents sont des tests manuels. Le vieux disque dur a cramé puis le nouvel ordi a été volé, j'ai été obligé de refaire la procédure d'édition sur Wikipédia... Avec le botflag, ce seront des éditions fréquentes (genre toutes les 2 minutes).
Faut que j'évalue aussi quand mettre le botflag. Est-ce que les éditions avec botflag sont immédiatement visibles dans la liste de suivi personnelle ? dans l'historique ? Car si y'a ajout de données, faudrait qu'un humain puisse vérifier. Faut que je relise les pages d'aide.
-- Irønie (discuter) 12 novembre 2019 à 18:57 (CET)
@Irønie : Pas besoin de mesures préventives d'après moi. --ZiziBot (discuter) 12 novembre 2019 à 23:37 (CET)

Fait compacte vs indentée[modifier le code]

Bonjour Ironie,

ton bot transforme une présentation indentée en présentation compacte (voir par exemple ici). Il me semble qu'il serait plus respectueux de conserver le désir du rédacteur de garder une présentation indentée souvent plus lisible. Mais peut-être est-ce plus difficile à programmer? HB (discuter) 15 novembre 2019 à 18:54 (CET)

Oui, respect style. Le bot conserve le style compact/indenté exemple. Là c'est bug avec une indentation particulière (retour ligne suivie de plusieurs espaces). Je m'en occupe en priorité. Merci du signalement.
-- — Irønie (discuter) 15 novembre 2019 à 21:01 (CET)
@HB Bug corrigé [1]. Ça a touché 8 articles. -- — Irønie (discuter) 15 novembre 2019 à 23:27 (CET)
Merci! Beaucoup de travail pour toi pour peu d'articles touchés en fait. HB (discuter) 16 novembre 2019 à 07:40 (CET) P.S. La notif par ping n'a pas fonctionné.
@HB : L'important, en ergonomie, c'est de trouver ce dont on a besoin là où on le cherche, quand on en a besoin. --ZiziBot (discuter) 16 novembre 2019 à 08:03 (CET)

Fait Paramètre lien titre[modifier le code]

Bonjour Ironie,

Le bot signale ici pour l'article Anneau principal que le paramètre lien titre n'existe pas alors qu'il est pris en compte et bien présent (mais déconseillé) dans la documentation du modèle {{ouvrage}}. Est-ce un comportement prévu et souhaité ou une petite anomalie ? -- Evynrhud (discuter) 16 novembre 2019 à 10:57 (CET)

@Evynrhud : Sympa pour ceux qui ne sont pas de ton avis... --ZiziBot (discuter) 16 novembre 2019 à 10:59 (CET)
@Evynrhud : Fait Oubli, hihi ! Je viens d'ajouter le paramètre au modèle (v0.27). J'ai corrigé les 3 articles touchés. Merci -- — Irønie (discuter) 16 novembre 2019 à 11:19 (CET)
@Irønie : Ok, parfait. Merci ! -- Evynrhud (discuter) 16 novembre 2019 à 11:22 (CET)

Fait Plume[modifier le code]

Désolé, c'est encore moi. Mais il y aurait éventuellement quelque chose à faire pour ce genre de cas : Andy Williams (chanteur). Qu'en penses tu ? -- Evynrhud (discuter) 16 novembre 2019 à 11:43 (CET)

Déjà vu, mais fréquence trop rare de cette erreur (plume) pour une gest-- — Irønie (discuter) 17 novembre 2019 à 12:27 (CET)ion automatisée. -- — Irønie (discuter) 16 novembre 2019 à 11:56 (CET)
Le message renvoyé en commentaire et dans la page de discussion n'est peut être pas totalement limpide et juste dans ce cas : le paramètre existe bel et bien mais c'est son utilisation qui n'est pas conforme (c.-à-d. pas de signe « = » et/ou pas de contenu pour le paramètre). Est-ce-que ce cas de figure ne concerne pas d'autres paramètres que plume ? -- Evynrhud (discuter) 16 novembre 2019 à 12:03 (CET)
C'est géré comme 1=plume, à l'identique des nombreux modèles qui acceptent des valeurs sans nom de paramètre ({{lang|en}}). La plume a peu de valeur encyclopédique. Des erreurs plus fréquentes sont des oublis de "=" ou des commentaires biblio. J'ai pas encore de statistiques sur ça. -- — Irønie (discuter) 16 novembre 2019 à 16:22 (CET)
Ok, je comprends mieux le message renvoyé. Tu verras plus tard pour éventuellement gérer le cas s'il se produit fréquemment. Tu as raison. Merci. -- Evynrhud (discuter) 16 novembre 2019 à 17:03 (CET)
Pour info, il n'y a que 133 cas identiques. Ce qui est effectivement vraiment très peu.
Par contre, j'ai regardé rapidement les stats des « paramètre sans nom » (texte sans nom de paramètre trouvé entre 2 séparateurs consécutifs) et il en existe une certaine quantité :
  • paramètre « 1 » : 9475 pages dont 3892 non vides ;
  • paramètre « 2 » : 764 pages dont 423 non vides ;
  • paramètre « 3 » : 57 pages dont 24 non vides ;
  • paramètre « 4 » : 14 pages dont 7 non vides ;
  • paramètre « 5 » : 6 pages dont 5 non vides ;
  • etc...
Quand le "paramètre" est vide c'est simple à traiter Sourire mais lorsqu'il y a du texte, je ne vois pas trop ce qui pourrait être automatisé à part de signaler l'erreur... -- Evynrhud (discuter) 16 novembre 2019 à 19:40 (CET)
J'imagine 2 solutions : 1) un signalement en page discussion (solution actuelle). 2) ou bien un système de correction (comparable au Amazon Mechanical Turk), avec une interface web qui permettrait à des humains de vérifier ou corriger facilement une citation après l'autre, en cliquant simplement sur des boutons. Ensuite le bot utiliserait les citations corrigées pour modifier les articles.
-- — Irønie (discuter) 17 novembre 2019 à 12:27 (CET)
Fait Bot passé sur tous les articles pour correction en 'plume=oui'. — irønie
Fait Message d'erreur plus clair en v0.45 : <!--VALEUR SANS NOM DE PARAMETRE --> — irønie

Fait Les interliens sur les titres sont cassés s’ils contiennent « : »[modifier le code]

Le robot transforme {{Ouvrage|titre=[[Dictionnaire des féministes : France, XVIIIe-XXIe siècle]]}} en {{Ouvrage|titre=[[Dictionnaire des féministes|sous-titre=France, XVIIIe-XXIe siècle]]}} comme ici. Il faudrait éviter de casser cette mise en forme. Il ajoute aussi des paramètres vides inutiles, mais au moins ils ne cassent rien. -- Okhjon (discuter) 17 novembre 2019 à 22:49 (CET)

@Okhjon : Je pense que la "redondance" n'est pas nécessairement une tare. --ZiziBot (discuter) 18 novembre 2019 à 01:15 (CET)
@Okhjon Bug critique du sous-titre. Peut-être la seule occurrence, mais il n'a pas touché plus de 8 articles. J'avais pas imaginé ou repéré ce cas pour mes tests. Je vais corriger. Merci.
Pour les paramètres vides, c'est un débat communautaire non-résolu[2]. Ils encouragent le complètement humain, mais ils compliquent la lecture du wikicode. Personnellement, j'aime pas. Globalement le robot supprime de nombreux paramètres vides sur les articles : il laisse (ou ajoute) seulement quelques paramètres « minimum ». Quels paramètres vides te semblent particulièrement inutiles ? (j'vais ajouter la question au sondage).
Sur Annik Houel (et une vingtaine d'autres) y'a eu également l'essai d'un arrangement stylistique touchant des citations non complétées par le bot, pour ça que l'ajout de paramètre vide est très visible sur ce genre de citation très incomplète. L'idée d'une homogénéité du style des citations sur un même article, mais cette fonctionnalité n'est pas validée par la communauté (sondage).
-- Irønie (discuter) 18 novembre 2019 à 13:24 (CET)
Je suis comme vous : je n'aime vraiment pas les paramètres ajoutés inutilement à vide. Ça n'a pas grand intérêt sauf à encombrer le code et je ne pense même pas que cela incite qui que ce soit à les compléter. Je reste convaincu qu'ils vont rester vides encore longtemps après le passage du bot... J'espère que le sondage permettra de faire basculer ce choix critiquable. -- Evynrhud (discuter) 18 novembre 2019 à 14:22 (CET)
Fait Ouais. Sinon bug corrigé (v0.32). -- Irønie (discuter) 18 novembre 2019 à 15:21 (CET)

Fait Traitements partiels et multiples sur certains articles[modifier le code]

Bonjour,
J'ai remarqué que : 1) Certains articles ont été traités plusieurs fois par le bot : 3 fois par exemple pour l'article Algérie. 2) Toutes les occurrences du modèle {{Ouvrage}} ne sont pas traitées lors du passage du bot sur certains articles.
Quelles sont les règles qui déterminent ces comportements ? Ne serait-il pas préférable de traiter complètement chaque article pour éviter d'y revenir ensuite ? -- Evynrhud (discuter) 18 novembre 2019 à 10:23 (CET)

@Evynrhud : Le précédent système étant sans doute plus souple, mais le nouveau le sera également, différemment. --ZiziBot (discuter) 18 novembre 2019 à 12:14 (CET)
@Evynrhud : Oui, une dizaine d'articles touchés par multiples passages. C'est un peu moche, je sais. En principe le bot ne devrait pas passer sur un même article avant 6 mois.
Initialement le bot modifiait maximum 5 citations, puis 10, puis 20. La limite est fixée actuellement à 40 : sur Algérie il a fait 40 citations[3] puis 21 autres. J'hésite à augmenter la limite (100?). C'est pas un problème technique mais un choix à faire : Les modifications "massives" évitent d'encombrer l'historique mais elles font peur à lire, sont compliquées à vérifier, et on n'ose pas annuler si erreur. Le bot évite provisoirement les AdQ et BA, en attendant un fonctionnement plus propre.
Aussi un dysfonctionnement (corrigé en v0.22) de l’enchaînement des processus. ZiziBot est composé de plusieurs programmes indépendants (workers) : obtention de liste d'articles, lecture d'article et détection des modèles, analyse des citations et stockage provisoire en base de donnée, édition sur Wikipédia, etc. Le processus final éditait parfois un article alors que toutes ses citations n'avaient pas encore été analysées.
-- Irønie (discuter) 18 novembre 2019 à 13:47 (CET)
Merci Irønie pour ta réponse très claire et précise. Tu l'auras compris, je suis vraiment partisan d'un seul passage qui fasse tout ce qu'il est possible de faire au moment où il passe. Ce pourrait être une question supplémentaire à ajouter au sondage en cours. Qu'en dis tu ? -- Evynrhud (discuter) 18 novembre 2019 à 14:28 (CET)
J'ai mis la limite à 100. Ça laisse de la marge... Oui, sondage. Ajoute si tu veux, sinon je ferai à l'occasion. Merci pour tes nombreux retours (recette informatique). - irønie
Fait v0.38 — irønie

Fait Bugs Éditeur, Sous-titre[modifier le code]

Bonsoir,

Le bot bugue sur Anna Hamilton. Après deux points, il ne faut pas de majuscule. Or il transforme Devenir infirmière en France : une histoire atlantique en Devenir infirmière en France : Une histoire atlantique ce qui est fautif.

Par ailleurs il transforme Éd. Hospitalières en Hospitalières ce qui est aussi incorrect. Ypirétis (discuter) 20 novembre 2019 à 00:17 (CET)

@Ypirétis : Sous-titre : les usages sont variés pour/contre la majuscule après le ":" (qui n'a rien à voir avec la règle du ":" dans les conjonctions de phrases) et les manuels typographiques pas précis[4]. Je viens de regarder, la convention WP:BIBLIO semble aller vers "minuscule", d'après un exemple présenté. Ça pourrait mériter un éclaircissement/débat. Je viens de corriger le code. Je vais corriger les articles dès que j'ai du temps.
Abréviation édition : J'avais corrigé le problème voilà quelques jours, mais les vieilles citations analysées n'ont pas été supprimées/corrigées et le bot les a envoyés sur WP. En plus j'ai cafouillé avec la base de donnée en essayant un revert des édits du bot (Smiley: triste) — Je vais voir pour corriger les articles.
Merci pour ces retours sur bugs critiques. -- Irønie (discuter) 20 novembre 2019 à 14:15 (CET)
J'ai commencé à vérifier/corriger. Pour la suppression de l'abréviation "éd.", dans la plupart des cas ça pose pas de problème (à l'inverse de ton cas "Éd. Hospitalières"). On retrouve souvent des mentions identiques abrégées sur Google/BnF ou la mention du même éditeur ailleurs dans l'article : par exemple "Seuil" au lieu de "éd. Seuil".
Pour la majuscule sous-titre, y'a les nombreux cas où le bot a importé le sous-titre d'une base : là la typo sans importance en comparaison de l'apport de donnée. Pour le reste des majuscules en sous-titre, j'hésite à annuler, en imaginant que ça pourrait être corrigé dans quelques mois par second passage du bot ou par des correctifs AWB. J'ai aussi l'impression qu'en anglais, la majuscule sous-titre est la norme.
A suivre. -- Irønie (discuter) 20 novembre 2019 à 17:03 (CET)

Correction de la typo des sous-titres en cours. (edits) -- Irønie (discuter) 20 novembre 2019 à 20:44 (CET)

Nettoyage sélectif[modifier le code]

Bonsoir,

J'ai été un peu surpris en passant sur ce diff : un modèle {{Ouvrage}} complètement "nettoyé" d'un coté et juste au dessus un autre laissé totalement inchangé alors qu'il révèle les mêmes symptômes (nombreux paramètres non renseignés). Je suppose que ce qui fait que le traitement les différencie c'est l'isbn qui est renseigné dans l'un et pas dans l'autre. Ne serait-il pas possible dans un premier temps de nettoyer aussi les modèles sans isbn même si leur données ne peuvent pas être encore enrichies et/ou corrigées par le bot ? -- Evynrhud (discuter) 22 novembre 2019 à 18:40 (CET)

@Evynrhud : Des paramètres sont plus simples à se rappeler que des modèles. --ZiziBot (discuter) 22 novembre 2019 à 18:42 (CET)
@Evynrhud : La différence c'est que les modifications possibles ont été jugées "cosmétiques" (invisibles au final) par le bot. C'est une option qui me prend 30 secondes à changer, pour inclure le nettoyage sur ces mentions. J'ai testé sur une dizaine d'articles. Mais j'ose pas, en attendant consensus. Surtout que j'ai encore retiré hier les paramètres vides 'langue' et 'pages totales'... Ton diff est sublime, ça servira d'argument. Sourire -- Irønie (discuter) 22 novembre 2019 à 19:09 (CET)
ça sert tellement à rien de garder tous ces paramètres vides même si ça n'est pas visible. Tiens au fait en parlant de choses inutiles ! Hier sur le bistrot, Speculos disait qu'il était inutile de laisser langue=fr (ou ses variantes) car c'était implicite. Tu vas suivre cette option ou laisser en l'état ? -- Evynrhud (discuter) 22 novembre 2019 à 19:21 (CET)
@Evynrhud : Je suis de ton avis, mais je suis prudent/peureux. Sinon le bot nettoie 'langue=fr', depuis midi je crois. —irønie
Aaah c'est bien ça déjà !!! Mais c'était quoi les arguments de ceux qui étaient partisans de garder les paramètres vides ? -- Evynrhud (discuter) 22 novembre 2019 à 19:34 (CET)
@Evynrhud : Encourage et facilite le remplissage. Mais bon, après quelques mois/années... Et les wikignomes font pas ce genre de boulot. -- Irønie (discuter) 22 novembre 2019 à 19:39 (CET)

Il ne faut pas nettoyer langue= fr ; si un rédacteur humain l'ajoute explicitement un robot n'a aucune légitimité à le retirer. Aucune règle d'aucune sorte ne l'y autorise même implicitement. Ypirétis (discuter) 22 novembre 2019 à 21:04 (CET)

@Ypirétis : Je pense que c'est une bonne chose. --ZiziBot (discuter) 22 novembre 2019 à 21:10 (CET)
Pas moi Ypirétis (discuter) 22 novembre 2019 à 21:13 (CET)
Zut! Mouais Corrigé v0.37. maximum 360 pages touchées maximum 46 pages touchées. -- Irønie (discuter) 22 novembre 2019 à 21:39 (CET)
Merci Ypirétis (discuter) 22 novembre 2019 à 21:41 (CET)

Interprétations et corrections d'erreurs[modifier le code]

En passant sur l'un des derniers diff issu du bot, je me disais qu'il ne devrait pas être bien compliqué pour son dresseur de traduire l'expression première édition=9999 par année de première édition=9999 plutôt que de sortir une erreur d'inexistence de paramètre (il y a 121 cas identiques actuellement). À toi de nous dire si t'as envie d'interpréter un peu plus en avant les erreurs de ces contributeurs bien sympathiques mais quand même très inattentifs...Sourire.
Cela m'a rappelé une demande de requête de bot qui avait pour finalité de corriger, entre autres, les libellés erronés de certains paramètres du modèle {{Ouvrage}}. Et tout cela pour te demander si tu avais connaissance de cette requête et des règles d'interprétation qui avait été appliquées à cette occasion et si celles-ci cela faisaient partie intégrante des règles déjà gérées par ton bot. Voilà c'est tout.Clin d'œil
PS: tes dernières modifs sur la page utilisateur du bot m'ont bien fait marrer ! Mort de rire -- Evynrhud (discuter) 23 novembre 2019 à 18:03 (CET)

Il faudrait préciser que les 3 euros sont reversés à la SPA, section "chats", tu as oublié de le faire... Ypirétis (discuter) 23 novembre 2019 à 18:12 (CET)
J'avais pas vu la requête. Pour un paramètre erroné, le bot essaye de résoudre le paramètre correcte en faisant une prédiction (basé sur distance de Levenshtein). Au final, il arrive à corriger beaucoup de typo et d'erreurs de frappe, genre "autuer", "présenation en lign", et trucs anglais. Ce type de correction apparait en commentaire pour vérification humaine. Ça m'amuse toujours de voir passer ça, car y'a un petit risque qu'il se trompe. Clin d'œil Au final, il corrige beaucoup des trucs demandés sur la Requête. Je regarderai plus en détail. -- Irønie (discuter) 23 novembre 2019 à 18:19 (CET)
Et pour la SPA ? Ypirétis (discuter) 23 novembre 2019 à 18:33 (CET)
@Irønie : Oui, si tu n'avais pas vu cette requête et la discussion derrière, je pense qu'il y a des choses très intéressantes à en tirer. ça peut te donner des idées. -- Evynrhud (discuter) 23 novembre 2019 à 18:54 (CET)
Fait alias 'première édition' ajouté. -- Irønie (discuter) 26 novembre 2019 à 11:33 (CET)

Fait isbn10[modifier le code]

Bonjour,

Votre bot a ajouté le isbn10 dans Anticyclone de l'île de Pâques et d'autres articles. Cependant, ça ne fonctionne pas car le paramètre isbn s'attend à une suite (isbn2=, isbn3=,…) alors il faut changer à chaque fois pour « isbn2= ». Veuillez corriger ce changement automatique.

Pierre cb (discuter) 24 novembre 2019 à 09:22 (CET)

Stop Votre bot continue à faire ce changement qui ne donnen rien à l,affichage (ex. sur Anticyclone d'Hawaï)! Pierre cb (discuter) 24 novembre 2019 à 15:14 (CET)
Notification Pierre cb : : Y'a pas d'erreur. Le bot a ajouté l'ISBN-13 qui correspond à l'ancien ISBN-10 (archivé dans 'isbn10'). S'agit du même livre, juste la référence a été normalisée à 13 chiffres. La nouvelle référence (13) est affichée et permet au lecteur de trouver le livre.
La doc explique : « Si l'ISBN composé de 13 chiffres est renseigné, l'ISBN équivalent composé de 10 chiffres peut être conservé dans ce paramètre. Il n'est pas affiché. »
Le non-affichage de l'ISBN-10 est une fonctionnalité du paramètre {{ouvrage}}. Votre correction [5] est erronée, 2-7605-0365-8 n'est pas un second ISBN. Si vous trouvez que l'ISBN-10 devrait être affiché en plus de l'ISBN-13, voyez Discussion_modèle:Ouvrage.
Merci néanmoins d'être venu pour signaler. Sourire -- Irønie (discuter) 24 novembre 2019 à 16:11 (CET)

Fait Paramètre langue[modifier le code]

J'ai vu que le bot conservait à l'identique le contenu du paramètre langue lorsqu'il est en anglais (ex : german, french, ...) comme ici par exemple alors que lorsqu'il est en français, il le transforme (ex : français -> fr, anglais -> en, ...). Il y a peut être un petit truc à faire, non ? -- Evynrhud (discuter) 24 novembre 2019 à 11:32 (CET)

Evynrhud : Parce que la gestion avancée de langue a disparu avec le vol de mon ordi. Y'a juste une gestion simpliste des variétés de langue (j'ai ajouté French). Je ferai ça sous peu. -- Irønie (discuter) 24 novembre 2019 à 16:19 (CET)
Ah mince ! Vraiment désolé pour toi. (Smiley: triste) J'espère que tu n'as pas perdu trop de choses. Merci d'avance pour les prochaines modifs. -- Evynrhud (discuter) 24 novembre 2019 à 16:37 (CET)
Il me semble qu'il y a ici un bug car, pour l'ouvrage " La Provence moderne ", le bot a renseigné la langue par en alors que celui-ci est bel et bien est en français. Kezako ? -- Evynrhud (discuter) 24 novembre 2019 à 19:16 (CET)
Google a renvoyé la langue anglaise [6]. Comme j'ai retiré l'ajout de 'langue=fr', y'a pas eu de prévalence de la langue (FR) fournie par la BnF (qui a fourni le sous-titre). Mouais Faut que je vois... -- Irønie (discuter) 24 novembre 2019 à 19:44 (CET)
C'est sournois ! Oh ! -- Evynrhud (discuter) 24 novembre 2019 à 19:54 (CET)
Je ne sais pas si tu as la possibilité d'estimer l'étendue du problème car le cas n'est pas unique, hélas (un autre cas avec l'ouvrage " Girodet, 1767-1824 "). -- Evynrhud (discuter) 24 novembre 2019 à 20:37 (CET)
@Evynrhud : Encore erreur de Google ! C'est problématique. 1) faut que j'arrête les éditions et l'analyse en attendant un filtrage par le bot. 2) ça me semble compliqué de lister les articles. Y'a eu des ajouts de langue (juste ou faux) sur 1023 474 articles (liste 474). Faut que je réfléchisse à une solution pour trouver lesquels. Merci de ton attention. -- Irønie (discuter) 24 novembre 2019 à 20:44 (CET)
Oui, c'est plus sage vu la quantité d'ajout de langue déjà effectué. -- Evynrhud (discuter) 24 novembre 2019 à 21:54 (CET)
J'ai peut-être une liste restreinte. 28 articles. Tes 2 exemples sont dedans. En misant sur ajout langue=en mais incohérence avec le code linguistique/marchand "2" (français) de l'ISBN. -- Irønie (discuter) 24 novembre 2019 à 23:20 (CET)
J'en ai trouvé plusieurs autres, je vérifie s'ils sont dedans. -- Evynrhud (discuter) 24 novembre 2019 à 23:24 (CET)
Il y a ces trois là au moins qui n'y sont pas : [7], [8] et [9]. -- Evynrhud (discuter) 24 novembre 2019 à 23:30 (CET)
Ouais c'est des éditeurs anglo (?) donc pas la zone 2 isbn (donc ma recherche pour mini-liste). La donnée langue n'est pas fiable, zut. —ironie
J'vais devoir bidouiller un mini-bot pour corriger cette semaine en semi-automatisé tous ces articles. Pfff trop chiant cette donnée. Elle permettait de mettre la langue sur plein d'ouvrages en anglais :( -- Irønie (discuter) 24 novembre 2019 à 23:42 (CET)

┌─────────────────────────────────────────────────┘
J'avoue que c'est bien lourd de tomber sur une donnée erronée issue d'un présumé "tiers de confiance" !!! Mais Il vaut mieux s'en apercevoir maintenant que dans 2 ans. Clin d'œil J'espère que ce ne sera pas le cas pour d'autres données... -- Evynrhud (discuter) 24 novembre 2019 à 23:49 (CET)

C'est surtout bizarre que langue soit fausse et pas le reste (le bot vérifie que titre/auteur quasi-identiques à WP pour l'import donnée). -- Irønie (discuter) 24 novembre 2019 à 23:58 (CET)
Fait erreurs langue réglé. Articles corrigés. — irønie
Juste pour mémo, l'italien n'est pas convertit, exemple ici -- Evynrhud (discuter) 26 novembre 2019 à 14:45 (CET)
Fait fait : Conversion des langues (v0.50) —irønie

Liens vers Google Books[modifier le code]

Depuis la reprise du bot ce matin, les deux modes d'appels dans les liens vers Google Books (lire en ligne=, présentation en ligne=, url=) sont utilisés : le modèle ou le lien brut. Et cela parfois même au sein d'un même article, exemple ici. C'est surprenant ! C'est un choix ou une période temporaire avant que cela s'harmonise (dans ce cas, vers quoi ?) ? -- Evynrhud (discuter) 26 novembre 2019 à 13:25 (CET)

User:Evynrhud : C'est la transition vers URL brute, pour tester pendant un moment si ça plait mieux. Sur cet article, les différentes citations n'ont pas été analysées/transformées aux mêmes dates. J'avais pas pensé que ça arriverait, pas grave. Les articles en "A" essuient les plâtres. Sourire
Dorénavant, un commentaire « bot [0.41/39] » signifie version 0.41 (version actuelle qui édite) mais version "0.39" pour la plus ancienne analyse de l'une des citation de l'article.
-- Irønie (discuter) 26 novembre 2019 à 15:00 (CET)
Oui, j'avais vu ce changement dans les commentaires. J'aurai préféré que tu attendes que le sondage soit plus fourni pour passer au lien brut car tu connais ma préférence. Clin d'œil Tant pis. -- Evynrhud (discuter) 26 novembre 2019 à 17:17 (CET)
J'ai pensé à la solution aléatoire si pas d'avis tranché : au hasard selon les articles, le bot met modèle ou bien lien brut. -- Irønie (discuter) 27 novembre 2019 à 11:34 (CET)

Liens éditeur et Liens auteur[n][modifier le code]

Le bot adopte deux comportements pour les liens éditeur : parfois le paramètre lien éditeur= est transformé en wikilien dans le paramètre éditeur= (comme ici), et parfois les deux paramètres sont conservés en l'état sans qu'ils soient fusionnés. Comment cela s'explique t il ? -- Evynrhud (discuter) 26 novembre 2019 à 14:52 (CET)

Le code est moche côté 'éditeur'. T'as un diff de non-transformation ? je regarderai sinon. -- Irønie (discuter) 26 novembre 2019 à 15:03 (CET)
Je n'arrive pas à retrouver le cas de non transformation que j'ai vu passé. J'essaie de le retrouver. -- Evynrhud (discuter) 26 novembre 2019 à 15:25 (CET)
Le cas se présente aussi pour les liens auteur[n], comme ici où le lien auteur n'est pas convertit en wikilien. -- Evynrhud (discuter) 26 novembre 2019 à 15:54 (CET)
J'ai retrouvé ces deux cas là mais ils s'expliquent : l'un parce qu'il n'y a pas de séparateur correct avant lien éditeur= [10] et l'autre car c'est une correction ponctuelle de sous-titre [11] mais je suis sur que j'en ai vu d'autres dans des cas différents de ceux-ci. -- Evynrhud (discuter) 26 novembre 2019 à 17:03 (CET)

Conversion paramètres pages et page[modifier le code]

Le bot convertit le paramètre pages= en pages totales= sauf que parfois il arrive que le contenu correspondent à un passage dans le livre comme ici par exemple pour l'ouvrage Xinjiang : China's Muslim Borderland. On a aussi le même dilemme avec le paramètre page= qui est transformé en passage= alors qu'il peut contenir le nombre de pages totales... J'ai pu constaté que les cas sont nombreux dans un sens comme dans l'autre (voir ici par exemple). Le nombre totale de pages de l'ouvrage, s'il est fourni par la base interrogée (Google books,...), doit permettre de différencier les cas et de faire les bonnes affectations. Sans connaitre le nombre de pages totales, il ne me parait pas judicieux d'interpréter et de transformer ces deux paramètres. T'es d'accord ? -- Evynrhud (discuter) 26 novembre 2019 à 19:35 (CET)

Evynrhud : 1) 'page' et 'pages' sont décrits comme des alias dans la doc du modèle. Donc le bot ne fait pas officiellement de bêtise.Clin d'œil 2) Page et/ou pages est aussi un paramètres du modèle anglais {Cite book} souvent converti plus ou moins automatiquement en {ouvrage}. Je me souviens plus et j'sais pas où on en est en 2019 côté {cite book}.
Je peux ajouter une vérification de présence de "-" ou "," => passage comme dans "93-104" ou "45, 58".
Oui, comparer à la data "pages totales" (Google, etc), c'était pas fait.
Est-ce que par défaut on réalise la conversion (selon la doc) ou bien on touche pas en signale en paramètre erreur. J'hésite par contre. Je crois même que je peux difficilement ne pas convertir : pour le bot 'page' est soit un paramètre, soit un alias, soit un paramètre erroné. Y'a pas de nuance.
-- Irønie (discuter) 27 novembre 2019 à 11:30 (CET)
Oui, ce serait déjà pas mal de faire : 1) si on détecte la présence de séparateurs ou de plages continues ou discontinues ("-", "–", ",", ";", "/", ".", "x à y", "de x à y", "x et y", "x & y", "x et suivantes", "x et suiv.", ...) ou si le contenu est inférieure au nombre de pages totales récupéré en base alors on effectue la conversion de pages= ou de page= en passage=. 2) Si le contenu de pages= ou de page= est égal au nombre de pages totales récupéré en base on effectue la conversion en pages totales= 3) sinon on ne convertit pas (car on pourrait reprocher au bot de relayer des erreurs manifestes) et on ne crée pas d'erreur (car on pourrait en avoir des caisses. Pour ça, j'hésite aussi)... Et lorsque pages totales= est renseigné, y a-t-il une vérification ou un remplacement avec le nombre de pages totales récupéré en base ? -- Evynrhud (discuter) 27 novembre 2019 à 12:11 (CET)
@Evynrhud : Non pas de comparaison encore entre data et pages totales. C'est facile/rapide à implémenter tout ça, j'ferai en priorité. J'hésite à couper le bot en attendant. D'un autre côté, les erreurs sont déjà affichées actuellement puisque page/pages sont des alias. Ou bien j'ajoute (2minutes) page et pages comme "paramètres normaux" de Ouvrage, et comme ça le bot y touchera pas et ne signalera pas en erreur (mais il ajoutera 'pages totales' d'après data).
-- Irønie (discuter) 27 novembre 2019 à 12:32 (CET)
Oui, en attendant les modifs ça me parait un bon compromis d'ajouter 'pages' et page' comme paramètre et effectivement pas la peine de couper. -- Evynrhud (discuter) 27 novembre 2019 à 12:44 (CET)
Pour les prochaines modifs, il serait bien aussi de convertir 'pages' ou 'page' en 'passage' si on détecte la présence d'une pagination en chiffre romain. Il existe de nombreux cas.-- Evynrhud (discuter) 27 novembre 2019 à 13:20 (CET)
J'ai ajouté provisoirement page/pages dans les paramètres normaux (v0.44) -irønie

Cas très particuliers ?[modifier le code]

Le bot s'est comporté assez bizarrement avec cet article. D'un coté, il corrige correctement une anomalie ('sous=titre') mais de l'autre il génère un autre problème ('mois=titre')... Tu seras meilleur juge que moi pour déterminer ce qui peut être corrigé dans le code dans ce genre de cas. -- Evynrhud (discuter) 27 novembre 2019 à 16:31 (CET)

Oui, la prédiction de paramètre est mal tombée. A cause du "=" dans "sous=titre", il a analysé un paramètre erroné sous et a déduit que le plus proche c'était "mois". Mouais Je pensais qu'il pouvait pas prédire pour un mot de seulement 4 lettres, faut que je peaufine réglage. Mais au final, il a ajouté le sous-titre (venu du Bnf ou Google), donc visuellement la citation est devenue parfaite ! Sourire -- Irønie (discuter) 27 novembre 2019 à 21:11 (CET)
Fait cas géré avec v0.45 — irønie

Paramètres editor, editor-first, editor-last, editor link, editor[n]-first, editor[n]-last, ...[modifier le code]

Il subsiste de nombreux paramètres issus de l'ancien modèle {{cite book}} qui semblent n'avoir jamais été convertis dans le modèle {{Ouvrage}} et qui par conséquent ne sont jamais affichés mais qui pour autant seraient importants à mentionner pour des ouvrages de langue anglaise. Je veux parler du paramètre 'editor' et de toutes ses déclinaisons ('editors', 'editor-first', 'editor-last', 'editor-link', 'editor[n]-first', 'editor[n]-last', 'editor[n]-link' avec n de 1 à 5) qui n'ont pas d'équivalents directs dans le modèle {{Ouvrage}}.

Vu la quantité, on pourrait peut être envisager un traitement automatique de ces reliquats en alimentant le paramètre 'champ libre' avec le contenu de tous ces champs en les concaténant s'ils sont renseignés bien évidemment. Ça pourrait donner schématiquement un truc du genre "Annoté par " (ou "Révisé par ", "Supervisé par "...) + ' editor' + 'editor-first' + 'editor-last', 'editor1-first' + 'editor1-last', 'editor2-first' + 'editor2-last', 'editor3-first' + 'editor3-last', 'editor4-first' + 'editor4-last', 'editor5-first' + 'editor5-last' (avec éventuellement les wikiliens en plus). Une autre possibilité serait d'utiliser un des champs 'auteur' (le premier non utilisé) en lui affectant la même concaténation de champs et de renseigner le paramètre 'responsabilité' associé avec "Ann.", "Rév." ou "Sup.". À voir ce qui convient le mieux.

Il pourrait être proposé en plus une validation humaine de cette transformation afin de garantir au mieux le résultat. Ça te semble faisable et envisageable ?

PS : Anciennes discussions sur le sujet : [12], [13] -- Evynrhud (discuter) 27 novembre 2019 à 18:30 (CET)

Techniquement, c'est facile (10 minutes). Voir si ça fait consensus, comme modification. Si ça convient avec le paramètre 'champ libre'.
Pour la validation, tu penses à quoi ? Déjà : un edit sans flagbot, ok.
Une page qui liste les articles modifiés avec la valeur des champs libres ? (plus chiant à faire, mes outils de log sont encore basiques)
-- Irønie (discuter) 27 novembre 2019 à 21:06 (CET)
En parlant du paramètre 'editor' et tous ses congénères, c'est pas top que le bot supprime de l'info comme ici ou ... Il aurait dû au moins les signaler en erreur. Je suis choqué ! Mort de rire -- Evynrhud (discuter) 27 novembre 2019 à 21:44 (CET)
Stop Ah zut. "Ditta Dolejšiová" a disparu. :( - irønie
8 articles avec "editor" dans le commentaire : Algèbre de De Morgan,Algorithme du gradient stochastique,Andrés Cea,Anna Sui,Antti Kupiainen,Apatosaurus,Appel chrétien-démocrate,Applicatif (grammaire) — irønie
Fait Bug corrigé.
! Attendre concaténation éditor1,2,3... à faire. -- Irønie (discuter) 29 novembre 2019 à 15:58 (CET)

Anomalie non détectée[modifier le code]

Le bot n'a pas détecté ou n'a pas su traiter à la ligne 643 de l'article Architecture romane un cas assez particulier. Il a supprimé tout ce qu'il n'a pas su gérer sans rien signaler... C'est vraiment problématique. Peux tu voir ce qu'il est possible de faire pour éviter cela ? -- Evynrhud (discuter) 29 novembre 2019 à 10:32 (CET)

@Evynrhud : C'est parce qu'il y'a un "=" à la fin. Donc c'est un paramètre inconnu et vide, qui est supprimé. A l'identique de caca=. Si y'avait pas eu un "=", ça aurait été conservé et signalé en erreur, comme ça arrive très souvent.
Mais y'a des centaines de paramètres inconnus et vides supprimés, c'est parfait normalement. Ça m'embête de tous les conserver, à cause d'une exception comme celle-ci : du texte qui finit avec un "=". Faut que je réfléchisse sur les implications.
-- Irønie (discuter) 29 novembre 2019 à 15:17 (CET)
Fait Bon, on teste la conservation paramètre erroné+vide avec v0.45. -- Irønie (discuter)
Une idée : utiliser la prédiction de paramètres connus et lorsque c'est trop éloigné d'un paramètre connu, il sort en erreur sinon il supprime. Ce serait une alternative, non ? On pourrait éviter ainsi de garder trop de m... ou de caca= plutôt ! Mort de rire -- Evynrhud (discuter) 29 novembre 2019 à 16:05 (CET)

ISBN en double[modifier le code]

Lorsqu'il ajoute un isbn (sur 13 positions), le bot ne détecte pas si celui-ci est déjà présent dans le modèle au niveau des autres paramètres 'isbn' ('isbn2' et 'isbn3') comme ici (lignes 1065, 1095, etc.) par exemple. Si tu pouvais voir si c'est compliqué à faire ou pas ? Merci. Clin d'œil -- Evynrhud (discuter) 29 novembre 2019 à 11:28 (CET)

Les doublons ISBN. Pas compliqué. Noté. ! Attendre -- Irønie (discuter) 29 novembre 2019 à 15:22 (CET)

Typographie titre/sous-titre[modifier le code]

Je constate que le bot améliore la typographie des titres et sous-titres anglais (exemple). Je comprends pas, je sais pas d'où ça vient, ça m'inquiète. J'imagine qu'il prend la typo de Google/Bnf, mais je me souviens pas avoir codé ça... Mouais -- Irønie (discuter) 30 novembre 2019 à 14:28 (CET)

Oui, effectivement, c'est inquiétant si toi, tu ne sais pas pourquoi et d'où ça vient. Mort de rire -- Evynrhud (discuter) 30 novembre 2019 à 14:34 (CET)

Fait Conversion de paramètre inconnu[modifier le code]

Sais-tu pourquoi la prédiction de paramètre a converti un paramètre 'citation' en 'lieu' comme ici ? Ça pourrait se corriger comment ? -- Evynrhud (discuter) 30 novembre 2019 à 21:14 (CET)

Stop @Evynrhud : Zut ! Il compare aussi aux alias de paramètres. Pour mot >= 8 caractères, il autorise 3 permutations/changements de lettre, je crois. -- Irønie (discuter) 30 novembre 2019 à 21:22 (CET)
Il a dû faire "citation" => "location" (anglais) => 'lieu'. Euh ?
Ou bien il a décidé que la citation méritait d'être visible et il a pris un paramètre vide au hasard :P -- Irønie (discuter) 30 novembre 2019 à 21:40 (CET)
applaudissement -- Evynrhud (discuter) 30 novembre 2019 à 22:01 (CET)
Seul occurence dans les 20k analyses, pas grave. 1) j'ai ajouté l'alias 'citation'->'extrait'. 2) faudra créer un suivi des prédictions de paramètres, pour qu'un humain puisse vérifier de temps en temps. -- Irønie (discuter) 30 novembre 2019 à 22:04 (CET)
Oui, pas grave c'est vrai, mais je voulais que tu confirmes ce qui me paraissait le plus plausible : citation -> location -> lieu. L'article a déjà été corrigé : 'citation' est devenu 'passage' (bof bof mais bon...). -- Evynrhud (discuter) 30 novembre 2019 à 22:12 (CET)
Ok. Faudra fixer le seuil d'erreur acceptable (%). hihi — irønie
On est entré dans une phase de réglages fins ! Clin d'œil -- Evynrhud (discuter) 30 novembre 2019 à 22:17 (CET)
Il serait peut être mieux de mettre 'extrait' comme alias de 'citation' (cf. documentation du modèle). Qu'en dis tu ?
Et pour info, il existe 281 pages avec le paramètre 'citation' dont 252 où il est renseigné. -- Evynrhud (discuter) 30 novembre 2019 à 22:53 (CET)
oui, j'ai mis l'alias vers 'extrait' (j'sais pas pourquoi j'ai écris ici 'passage') — irønie

Quelques remarques sur ZiziBot[modifier le code]

Bonjour Notification Irønie.

Je sais que je n'ai pas été tendre avec ton bot par le passé, et je le regrette. Aujourd'hui je vais tenter d'être plus constructif, et j'espère que tu en tiendras compte. Je vais prendre exemple sur cette modification :

  • Ton bot duplique nature ouvrage= dans sous-titre=. Or « actes du colloque universitaire... » est bien une description et en aucun cas un sous-titre. Il n'apparaît ni sur la couverture ni sur la page de faux-titre. Et c'est extrêmement lourd d'avoir le même texte à la fois en sous-titre et en nature ouvrage.
  • Ton bot ajoute lieu=Paris sauf que l'ouvrage n'a pas été édité seulement à Paris (par LGDJ), mais aussi à Saint-Denis (par l'université de la Réunion).
  • Ton bot ajoute la notice BNF qui fait doublon avec l'ISBN : c'est inutile et lourd.
  • Ton bot remplace isbn=2-275-00221-9 par isbn=978-2-275-00221-7 et isbn10=2-275-00221-9. L'ISBN renseigné par isbn10= est masqué. Deux problèmes :
    • dans le cas général, les ouvrages d'avant 2007 ont été édités avec un ISBN-10. Pour ces ouvrages, mettre un ISBN-13 à la place de l'ISBN-10 avec lequel ils ont été publiés :
      • est anachronique ;
      • pose problème du point de vue de la recherche, car certains catalogues (celui de la BNF par exemple) vont trouver les ouvrages parus avant 2007 quand on les recherche avec l'ISBN-10, mais pas avec l'ISBN-13. Donc masquer l'ISBN-10 est une très mauvaise idée. Et afficher les deux ISBN est inutile et lourd, car comme tu le sais, l'ISBN-13 se calcule à partir de l'ISBN-10. Le mieux est de simplement laisser l'ISBN-10 dans le paramètre isbn=.
    • sur ce cas d'espèce, l'ISBN-10, 2-275-00221-9, renvoie vers le bon ouvrage sur le catalogue de la BnF, mais l'ISBN-13, 978-2-275-00221-7 renvoie sur un autre ouvrage. J'ignore pourquoi, c'est une anomalie du catalogue de la BnF, car sur le catalogue du SUDOC pas de problème.

J'annule donc la modification de ton bot, qui sur ce diff n'a rien ajouté d'utile, et a introduit des erreurs. Je ne nie pas qu'il fait des choses bien ailleurs, et merci pour cela, mais ici, non. Merci de corriger en conséquence. — Hr. Satz 1 décembre 2019 à 16:21 (CET)

@Hr. Satz salut. Tu as bien fait de réverter, puisque le bot a introduit des erreurs.
  • La redondance entre 'nature ouvrage' et 'sous-titre' n'avait pas été détectée. Les données de la BnF (ici) mettent la description "actes du colloque universitaire tenu à Mamoudzou (etc)" dans le champ qui correspond à sous-titre, ce qu'il est en quelque sorte puisque 'nature de l'ouvrage' serait plutôt restreint à "acte de colloque", je pense (sans les détails supplémentaires de date, lieu, nature de l'évènement). Solution : filtrer les sous-titre avec "colloque" et/ou ne pas ajouter de sous-titre quand il existe déjà un paramètre 'nature ouvrage'. Y'a déjà un blocage de l'ajout de sous-titre en cas de titre de volume/tome/chapitre, ça manquait pour nature ouvrage. Fait corrigé
  • Lieu : effectivement. Bug du bot qui ne gère pas les lieux multiples, alors que la donnée indique plusieurs lieux d'édition. Fait corrigé
  • Pour l'ISBN, le bot respecte les spécifications du modèle. C'est un débat plus général à avoir sur les identifiants. Considérer la conversion en isbn13 "anachronique" est un point de vue (un biais de bibliothécaire, je dirais). C'est un algorithme tout bête, qui permet de passer de l'un à l'autre et de normaliser les identifiants (notamment pour le commerce), et ça date des années 1990 je crois. Aussi sur WP l'ISBN n'est pas destiné à ranger/trouver un bouquin dans un rayon, mais à se connecter à différentes bases de données bibliographiques (dans le même sens, les infos sur le format physique du bouquin me semblent superflues sur WP). Les bibliothèques françaises ont mis 10 ans à accepter l'ISBN (1970-1980) et oui, la recherche BNF semble incapable de trouver un livre d'après la correspondance ISBN-13/ISBN-10. Faudra attendre 2029, j'imagine... J'te parle même pas de leurs formats de données, c'est un voyage dans le passé du web. Peut-être que frwiki doit gérer cette incapacité technique de la BnF (ou pas), avec les modèles : suffit de modifier {{ouvrage}} pour qu'il affiche l'ISBN-10. L'affichage et la présentation, c'est la responsabilité du modèle, selon moi.
  • C'est pas le sujet, mais la mise en forme ISBN avec tirets me semble aussi superflue. Ça plait aux bibliothécaires (fierté du mystère compris), mais y'a aucune utilité pour le lecteur sur Wikipédia. J'aime bien le style compacte et original "978-1234567890" que j'ai vu un contributeur utiliser. On s'en fiche de ce qui se cache derrière les chiffres !
  • L'identifiant BNF fait partie du modèle, donc le bot l'ajoute. J'ai besoin d'un consensus pour considérer qu'il est inutile ou même superflu. (à retirer alors?) Personnellement, j'aime pas ce lien qu'il crée vers la notice BnF. Sinon le modèle peut être modifié pour ne pas affiché le 'bnf=' si 'isbn=' existe. L'action du bot soulève un débat, mais ce débat concerne plutôt les modèles et les mentions bibliographiques en général.
Voilà un début de réponses. Faut lancer des débats. -- Irønie (discuter) 1 décembre 2019 à 17:43 (CET)
Lieu="Paris/Saint-Denis" ou "Paris, Saint-Denis" ? -irønie
Merci beaucoup pour ta réponse ! Je reviens vers toi dans le détail dans la soirée. — Hr. Satz 3 décembre 2019 à 09:52 (CET)
Notification Irønie :
  • Je ne savais pas que ce genre de qualificatif (« actes de... ») était formellement identifié comme un sous-titre dans le catalogue de la BNF. Dans le même champ tu dois certainement voir des « roman », ce qui n'est clairement pas un sous-titre. Et pour les « actes de », j'ai l'impression d'avoir vu (mais sans avoir d'exemple à citer) que le catalogue de la BNF ne retranscrit pas ces « sous-titres » de manière toujours exactement conforme à ce qui apparaît sur la page de titre, ou que ça apparaît parfois dans le catalogue de la BNF mais sans que ça apparaisse sur la page de titre. C'est pourquoi j'ai pris l'habitude de les encoder en nature ouvrage, car je les ai toujours vus comme une description de l'ouvrage plus que comme de la titraille. Mais peut-être que mes impressions sont infondées. Du coup en sous-titre ça va aussi (tant que ça doublonne pas avec nature ouvrage). Tu risques d'en trouver quelques autres comme ça, qui viennent de moi. Il va y avoir des actes de colloques, de conférences, des catalogues d'exposition, etc. Difficile de trouver le bon filtre. Désolé pour le boulot supplémentaire que je te cause avec cette habitude que j'ai prise par le passé.
    J'en sais rien. Y'a des documents sur la norme de ce petit détail. Je prends la zone 200-e définie comme "Complément du titre : Sous-titres et compléments du titre rattachés au titre propre de la ressource (EX 1, 2, 10). Il n'inclut pas les variantes de titres telles que le titre de dos, le titre de couverture et les autres titres figurant dans la ressource mais en-dehors de la source principale d'information.  ». [14]
    Les cas problématique de "Roman" en sous-titre concernait Google/OpenLibrary, dont les données sont moins fiables et la structure de donnée plus simple. Je ne sais pas si les données BnF envoient ce genre de mauvaise info, alors que leur donnée est beaucoup plus structurée ([15]). Mais peut-être que si. —irønie
  • Pour le lieu, le problème c'est que {{ouvrage}} ne gère qu'un seul lieu et un seul éditeur. Idéalement il faudrait lieu1=, éditeur1=, lieu2=, éditeur2=. Dans le cas présent ça donnerait « Paris, LGDJ, et Saint-Denis, université de la Réunion ». Comme ce n'est pas possible avec le modèle, j'ai pris l'habitude de ne pas renseigner le lieu quand il y a 2 éditeurs avec 2 lieux différents. Du coup je n'ai pas trop d'idée sur la meilleure solution à appliquer, à part de modifier le modèle.
    J'sais pas, mais je suis obligé de choisir une solution. Le vide, c'est possible. Maintenant, le bot affiche éditeur=Pif/Paf|lieu=Paris/Berlin pour la double édition. Voir si ça convient. -irønie
  • Pour l'ISBN je peux comprendre tes arguments (le mien sur l'anachronisme est anecdotique, pour moi le plus important c'est de retrouver l'ouvrage dans les catalogues via Spécial:Ouvrages de référence), mais du coup avec ta proposition ça afficherait les 2 ISBN en même temps, donc un peu superflu aussi. L'impossibilité de retrouver un ouvrage pré-2007 avec un ISBN-13, je crois qu'il n'y a pas que le catalogue de la BNF, c'est un problème plus général. Et quand tu dis que le bot respecte les spécifications du modèle, dans la doc je ne vois pas qu'il est obligatoire de saisir l'ISBN-13 dans isbn= et l'ISBN-10 dans isbn10=. Ça te pose vraiment problème de laisser l'ISBN-10 dans isbn= pour les ouvrages parus avec un ISBN-10 ? Pourquoi ? Bien sûr s'il n'y avait pas ce problème de recherche dans les catalogues je n'insisterais pas, mais là c'est vraiment pas pratique (et pour moi afficher 2 ISBN identiques à l'algo près, juste à cause de ça, n'est vraiment pas une option).
    Facile de ne pas toucher l'ISBN-10. Mais j'ai constaté que les bases modernes (Google, Worldcat, Amazon...) géraient et affichaient l'Isbn-13, donc ça m'avait semblé logique en 2019 de proposer ça pour Wikipedia, plutôt que se régler sur les normes BnF. Soudain j'me dis que ce n'est plus aussi utile, voire que c'est gênant de convertir. En même temps, j'ai pas envie qu'on s'oblige à attendre l'évolution de la BnF. Surtout je considère que l'affichage est la responsabilité du modèle et que je ne devrais pas m'en soucier : ça m'embête de ne pas ajouter une donnée (ISBN-13), au prétexte d'une conséquence sur l'affichage. Mouais
  • Les tirets servent quand même à voir facilement le numéro d'ordre chez un éditeur. Ça peut avoir son intérêt quand tu as un ISBN pour une édition brochée et un autre pour une édition reliée, tu vois tout de suite ce qui est commun (l'éditeur) et ce qui diffère (le numéro d'ordre). Ça permet de repérer plus facilement des erreurs. Et esthétiquement ça donne moins l'impression d'une masse informe. C'est pas fondamental non plus, mais 3 ou 4 caractères c'est pas la mort non plus...
    Ben justement, je trouve inutile de distinguer l'edition brochée/reliée sur Wikipédia. Quel cas pratique pour illustrer l'utilité pour le sourçage sur Wikipédia ou la vérification des ouvrages ? Selon moi, le support physique on s'en fiche, contrairement à une bibliothèque. L'ISBN est suffisant. D'ailleurs je n'importe pas les infos physiques de l'ouvrage (dimensions, broché, etc). Je constate aussi que Google et d'autres trucs modernes (WC), s'emmerdent plus avec les tirets : 978123456789. Sur ordinateur en 2019, les chiffres sont cliqués (ou copié-collés), y'a aucun intérêt pour l'ergonomie utilisateur. Faut se départir des logiques de stockage/classement des livres, qui nous concernent pas : se demander seulement : est-ce utile sur Wikipédia ? Est-ce que ça rajoute de la valeur aux articles ? Est-ce qu'on y gagne du fric ?
  • Pour la redondance BNF / ISBN, c'est pas faux, donc finalement pas de problème de mon point de vue à ce que ton bot ajoute les références BNF, puisqu'au pire il suffit de modifier le modèle pour les masquer comme tu le suggères.
    Ok. Faut quand même lancer débat sur l'affichage (ou pas) de la notice Bnf si y'a l'ISBN. J'ai l'impression que ça plait aussi parce que le lien automatique sur l'ISBN pointe vers une page chiante. Faudrait un gadget qui permette de choisir la base de donnée vers laquelle pointerait les liens ISBN, j'imagine.
Question annexe : tu es bibliothécaire ? Je ne le suis pas (ça doit se voir Langue pendante !). — Hr. Satz 3 décembre 2019 à 19:39 (CET)
  • Non. Je bosse dans le web et les données, dans le privé. Pour ça que j'aime Google et que j'ai souvent une approche énervée ou moqueuse du numérique dans les administrations ou les bibliothèques (avec leur lenteur, l'obsession des normes, etc). :-|
Notification Herr Satz : : Je réponds brièvement ci-dessus, j'y reviendrai, car j'ai pas forcément les réponses. Pour coder, souvent je suis obligé de "décider" tout seul, d'une comportement du bot, sans savoir si le choix est sans importance ou bien épineux. -- Irønie (discuter) 4 décembre 2019 à 16:17 (CET)
Notification Herr Satz : Voir aussi Discussion modèle:Ouvrage#ISBN-10 et ISBN-13.

Quelques cas glanés de-ci de-là[modifier le code]

J'ai relevé sur les dernières modifications du bot quelques nouveaux cas sans gravité :

  • Lorsque un lieu est ajouté, il arrive qu'il ne soit pas en français (ex : Cairo, Beijing, ...). Est-ce parce que ces villes ne figurent pas encore dans ta liste ou parce que tu ne fais pas la traduction du lieu après l'appel aux bases ?
    Pas dans la liste. Manque les noms anglais (de villes non-américaines et non-britanniques). Mouais Fait — irønie
  • Lorsqu'il existe un paramètre 'date=' avec un contenu autre qu'une simple année, il est inutile d'ajouter le paramètre 'année=' à vide en plus comme ici par exemple.
    Ah oui. Bug logique. Un peu chiant à corriger. Fait corrigé — irønie
  • Il n'est pas utile de lever une erreur si le contenu d'un "paramètre sans nom" est vide comme ici par exemple. -- Evynrhud (discuter) 1 décembre 2019 à 20:42 (CET)
    Oui. Bug suite à la correction des suppressions de caca=, hihi. J'avais déjà vu et corrigé (sans changer la version). Voir si ça apparait en v0.46. — irønie
  • ce cas en ligne 4, c'est quoi ces isbn invalides, ils sortent d'où ?
    Stop zut, c'est quoi ce probleme ISBN ! — irønie
    Ok. Une API a envoyé comme ISBN le texte "0-415-97235-3, 978-0-415-97235-2" et le script a détecté que c'était un ISBN mal formé (trop long et virgule) et a transformé ça en isbn invalie et l'a ensuite injecté dans la citation WP. :D Fait j'ai bloqué l'import du paramètre isbn invalide. Seul article touché.
    Sinon sur Apitxat, un ISBN erroné mais officiel, mais le bot n'a pas touché (à cause du commentaire invisible). Faudra que je teste ce problème des ISBN officiels qui respectent pas le checksum ISBN. Pareil histoire d'ISBN "rectifiée" pour Arques (Aveyron) data BNF.
    Ok vérifié, ça va. -- Irønie (discuter) 4 décembre 2019 à 20:52 (CET)
    Merci Evynrhud -- Irønie (discuter) 1 décembre 2019 à 21:51 (CET)

NB : les ping et notif en commentaires ne marchent pas...Clin d'œil -- Evynrhud (discuter) 1 décembre 2019 à 21:03 (CET)

Ok Sourire. J'ai ajouté quelques villes en anglais. — irønie

Bilan décembre[modifier le code]

Enfin ! Le bot commence à faire de jolis éditions. J'ai ajouté dernièrement la conversion de 'langue', la création de page discussion pour message d'erreur. Et l'import de liens Google pour 'présentation en ligne' quand le livre est d'accès partiel.

  • Le processus d'analyse fonctionne correctement, mais j'ai pas obtenu de réponse de Google pour une augmentation du quota quotidien (actuellement 1000/jour). Ça ralentit tout, j'vais réfléchir à ignorer Google quand les données BnF peuvent suffire, ce qui permettra peut-être de doubler la cadence. Le quota compromet aussi mon idée de conversion des <ref>http://books.google</ref> en {ouvrage} (car ça ajouterait minimum 1 an de traitement, d'après mes calculs...)
  • Faut améliorer le tableau de surveillance
  • Faut que j'installe le bot sur Toolserver.

Parmi les améliorations "wiki" prioritaires :

  • concaténation editor,editor2... dans "champ libre"
  • conversion un peu intelligente de page/pages vers passage/pages totales

Sinon y'a quelques sondages/consensus à lancer parfois liés au modèle : rendre visible 'isbn10' ? ne pas convertir ISBN-10 en ISBN-13 ? Quels paramètres minimum inclure ? etc

-- Irønie (discuter) 7 décembre 2019 à 17:39 (CET)

Pour les champs 'editor' et associés ('last-editor', 'first-editor', 'link-editor'...), une autre possibilité, qui peut apparaître moins "fourre-tout" que de tout mettre dans 'champ libre' serait d'alimenter les champs 'auteur[n]' pour chacune des occurrences trouvées et d'indiquer dans les champs 'responsabilité[n]' associés leurs rôles. À voir. -- Evynrhud (discuter) 10 décembre 2019 à 05:42 (CET)
@Evynrhud : Ouais. Faudrait que je lise les discussions à ce sujet. Les deux solutions, c'est facile à faire et ça me prendrait peu de temps, mais encore faut-il que je sache quel résultat est souhaité. Mouais Mettre responsabilité3=éditeur ? -- Irønie (discuter) 10 décembre 2019 à 12:59 (CET)

Références modifiées sans nécessité[modifier le code]

Bonsoir.

Je vois que le robot commence à modifier des articles dans ma liste de suivi et à vrai dire, il m'inquiète. En effet, la bonne tenue d'une liste de suivi demande qu'icelle soit soigneusement vérifiée et le robot peut cacher des vandalismes précédant son intervention. Par exemple remplacer |auteur par |auteur1 n'aide en rien, mais pollue une liste de suivi. En outre, il ajoute |langue=fr pour un ouvrage rédigé en français, ou d'autres modifications ne servant à rien. Je ne vois pas trop l'intérêt de tout ça. Malosse [Un problème de météo ou de planeur?] 9 décembre 2019 à 02:26 (CET)

@Malosse : Avec la formulation actuelle, telle que je la comprends à savoir que cela n'interdit pas toute autre forme de présentation. --ZiziBot (discuter) 9 décembre 2019 à 02:58 (CET)
Je vais examiner plus soigneusement mes différences dans ma liste de suivi et voir si ces changements étaient vraiment nécessaires. Merci d'avance. Malosse [Un problème de météo ou de planeur?] 9 décembre 2019 à 05:12 (CET)
Tu parles des corrections de type "invisible" (non-cosmétique?). Oui, il n'est pas pertinent pour le bot d'éditer un article seulement pour des modifications invisibles. C'est pour cela que le bot ne le fait jamais et que tu ne fournis pas de diff.
Ensuite s'opposent une idée de conservation du style original et une idée d'harmonisation globale des citations. D'après ce sondage, les gens sont favorables à ce que le bot profite de son edit sérieux pour faire quelques harmonisations invisibles. Pour langue=fr, y'a pas de consensus.
Ensuite la plupart des edits du bot n'apparaissent pas sur les listes de suivi. C'est seulement quand y'a des ajouts sensibles de donnée (à vérifier, erreurs détectées), que l'edit est visible.
-- Irønie (discuter) 9 décembre 2019 à 12:07 (CET)
  • Pour les erreurs de paramètre signalés par le bot (exemple), l'edit est dorénavant masqué sur la liste de suivi (botflag). L'ajout d'un message en page discussion peut suffire à indiquer la correction à faire. Ça concerne moins de 3% des edits du bot (15 articles/24H). Faudra voir si c'est rentable, c'est à dire si les humains corrigent aussi souvent les erreurs que quand l'edit était visible dans la LdS.
  • Les ajouts importants, visibles sur LdS représente 35% des citations mais seulement 8% des edits (soit environ 40 articles/jour). Pas de quoi flooder les listes de suivi normalement. Perso, j'ai une LdS de 10'000 pages, j'ai vu passer ZiziBot qu'une ou deux fois depuis un mois. -- Irønie (discuter) 9 décembre 2019 à 15:07 (CET)
Sinon la conversion auteur=>auteur1, c'est un truc automatique car le bot est basé sur la documentation qui explique que "auteur" est un alias. Ne pas convertir auteur=>auteur1 demande 2 heures de développement/test/déploiement/vérification, pour une fonctionnalité qui n'apporte absolument rien au lecteur ni au rédacteur. Et comme j'suis pas payé à l'heure... SourireIrønie (discuter) 10 décembre 2019 à 16:10 (CET)

identifiant bnf utile ?[modifier le code]

J'ai retiré l'ajout d'identifiant bnf après avoir remarqué plusieurs critiques dans les commentaires d'édition. Le modèle pourrait gérer l'affichage (ou non) de la notice BnF selon la présence de l'ISBN. En attendant consensus ou modification du modèle, j'ai retiré les ajouts par le bot.

J'ai aussi retiré l'ajout de langue originale car je sais pas si c'est utile. L'ajout de titre original me semble un peu compliqué (doublon avec titre, etc), je verrai plus tard.

Ping Evynrhud Ypirétis -- Irønie (discuter) 9 décembre 2019 à 15:38 (CET).

L'ajout de la langue originale me paraissait être une bonne chose pourtant. Perso, je la garderais. Pour les autres infos que tu as retiré, ça peut en faire couiner certains (la preuve...). Pour moi, ça n'était pas problématique au contraire. -- Evynrhud (discuter) 9 décembre 2019 à 16:03 (CET)
Bonjour, pour le premier point, pour moi c'est Ok, si isbn alors pas d'identifiant BNF. Sinon, pour le second, pourquoi retirer langue originale et titre original ? La traduction française du titre original est parfois très éloignée, c'est utile. P. ex. De l'inégalité parmi les sociétés : essai sur l'homme et l'environnement dans l'histoire est la traduction d'un ouvrage titré en anglais Guns, Germs and Steel: The Fates of Human Societies. Utile de préciser... Ypirétis (discuter) 9 décembre 2019 à 16:44 (CET)
Le bot ne retire par 'langue originale' si elle est déjà dans {ouvrage}. Il ne l'ajoute plus à partir des données BnF. Actuellement le bot n'ajoute pas de 'titre original', car j'ai pas eu le temps (faut détecter si ce titre n'est pas déjà inclus genre titre=Salut le monde (Hello world)). Bon j'vais voir.
— irønie

Conversion ISBN-10[modifier le code]

Discussion sur enwiki à propos de la pertinence (ou pas) d'une conversion isbn10->13 : https://en.wikipedia.org/wiki/Help_talk:Citation_Style_1#What_to_do_about_ISBN-10s Sur enwiki, le bot Citebook fait déjà la conversion isbn13 pour les livres publiés à partir de 2007, année de mise en service de l'ISBN-13.

Je retiens les arguments :

  • La conversion en 13 n'est pas du travail inédit. C'est une formule math simpliste, et le résultat est identique par un bot ou par le formulaire officiel.
  • L'ISBN-13 n'est pas un nouvel identifiant, mais une "représentation" différente (de l'ancien isbn10)
  • Google peut sourcer la conversion en 13.
  • "Même si l'ISBN-13 n'est pas imprimé sur le livre, ça reste un moyen correct de se référer au livre. A l'identique d'un identifiant moderne DOI ou ISSN qui peut faire référence à un article publié en 1800. "

Je ferai une synthèse et un mini-sondage j'sais pas où. Si {ouvrage} n'est pas modifié pour afficher isbn10, ZiziBot ne convertira plus. En attendant que BnF soit compatible en 2022. -- Irønie (discuter) 10 décembre 2019 à 13:44 (CET)

Ok, sur le bistro Wikipédia:Le_Bistro/10_décembre_2019#Conversion_ISBN-10_en_ISBN-13

Signalement dysfonctionnement[modifier le code]

Stop Bonsoir, je ne connais pas ce bot ni ce qu'il est censé faire mais manifestement il disjoncte. Il a inséré plein de liens rouges inconnus sur un article ([16]). J'ai annulé sa modification mais je n'ai pas vérifié s'il avait fait d'autres dégâts ailleurs. Bonne soirée. -- Guil2027 (discuter) 12 décembre 2019 à 00:56 (CET)

@Evynrhud : Sinon c'est sans fin et ça devient une juxtaposition des travaux des différents projets et non plus une coopération pour aboutir à un article commun satisfaisant. --ZiziBot (discuter) 12 décembre 2019 à 04:07 (CET)
@Guil2027 : Un bug avec le test de conversion de tome/volume en chiffres romains, car sur cet article les valeurs de volume sont supérieurs 100 et qu'il n'existe pas de modèle (du style {{IV}}).
Juste 2 articles touchés Aventures et Passions et Aux Marocains.
Merci du signalement (et merci User:Evynrhud). -- Irønie (discuter) 12 décembre 2019 à 13:48 (CET)

Applique la typographie française pour des ouvrages en anglais[modifier le code]

Stop Bonjour Irønie, Il va falloir trouver d’où viennent ces rectifications typographiques, parce que parfois elle se fait dans le mauvais sens, comme sur « Bayer (entreprise) » : le robot a jouté des espaces avant les deux-points et a mis des minuscules là où il y avait des majuscules, alors que le paramètre « langue=en » était bien précisé. Si ça vient d’une BDD, il faut voir le niveau de fiabilité de la BDD, on est peut-être face ici à deux malheureuses exceptions, mais vu la qualité de la typographie d’habitude sur le web, j’ai peu d’espoir… SourirePols12 (discuter) 12 février 2020 à 13:52 (CET)

@Pols12 2 problèmes distincts :
  • La typo « espace avant deux points » pour distinguer un sous-titre est correcte, quelque soit la langue. Convention bibliographique (avec l'espace géré par le modèle). Sans rapport avec la règle typo « pas d'espace avant double point » concernant les textes/phrases en anglais. Faut que j'écrive une FAQ, c'est déjà expliqué/sourcé ailleurs (sur cette page?)
  • Le changement de typo avec mise en minuscule : oui, c'est problématique. Bien que la typographie en minuscule introduite par le bot (et la base de donnée) ne soient pas erronnée. S'agit des deux variations de style des titres anglais : l'ancienne (majuscule sur chaque mot) et la moderne (minuscules) ; le style dans la BDD est moderne, mais c'est pas considéré comme une erreur bibliographique. Expliqué simplement, s'agit d'un choix/fantaisie stylistique de l'éditeur et y'a pas de convention bibliographique wikipédienne sur le style préféré (idem sur enwiki). La tendance (statistique) est que le bot améliore généralement dans le bon sens la typo des titres (majuscules sur noms propres, etc), et ne commette pas d'erreur. Mais dans le cas que tu soulèves, sa modification stylistique n'est pas utile, voire gênante (choix initial du rédacteur). Faudrait donc supprimer cette modification majuscule/minuscule (ou detecter le style classique/moderne des titres anglais) : je l'avais pas encore fait car je trouvais que c'était un détail secondaire et peu fréquent.
Merci d'avoir soulever le problème avec ce bel exemple. -- Irønie (discuter) 12 février 2020 à 14:05 (CET)
(au moins 1000 conflits de modif successifs… ^^) Merci Irønie, j’aurai appris quelque chose (et désolé d’avoir crié à l’erreur de suite). Par contre, s’il y a sous-titre, mieux vaut utiliser le paramètre « sous-titre », non ? Ça éviterait cette question typographique ici, si tu dis qu’elle est récurrente. Merci pour ton travail de dresseur ! SourirePols12 (discuter) 12 février 2020 à 14:21 (CET)
Le bot ne déplace pas en sous-titre quand il détecte plusieurs double-points (second ouvrage modifié dans ton diff). Parce que ça semble un titre compliqué et que j'avais la flemme. Ou bien parce qu'il y'a une incohérence entre le sous-titre de la base biblio et celui de Wikipédia. Sinon tu as bien fait de stopper le bot puisque sa modification était très louche (enfin, ça a pas stoppé le successeur CodexBot).
Je jette un oeil dès que possible à cette partie du code.-- Irønie (discuter) 12 février 2020 à 16:55 (CET)