Discussion utilisateur:CodexBot

    Une page de Wikipédia, l'encyclopédie libre.

    Robot icon.svg CodexBot (edits) + ZiziBot (edits)DiscussionsFAQSondageMonitoring • Configuration : sites externesdomain banISBNvilles

    Cette page est dédiée à toutes les discussions concernant le robot CodexBot (bugs et suggestions).
    Pour rapporter une anomalie du robot, merci de mentionner le nom de l'article.
    Le bot répond parfois !

    Consultez aussi la Foire aux Questions (FAQ) et participez au sondage.

    Stop Le bot arrête ses éditions (s'il le veut bien) en écrivant {{stop}} ou STOP dans votre message (dans le doute, faites-le!).


    Consulter la page d'archive ici
    Les fils de discussion âgés de plus de 60 jours sont archivés automatiquement.

    Bot à l'arrêt[modifier le code]

    Salut,

    Le bot ne fonctionne plus (ou quasiment) depuis plusieurs jours maintenant et c'est bien dommage je trouve. Que se passe-t-il ? Cela va-t-il encore durer ? J'espère que non... - Evynrhud (discuter) 3 juin 2021 à 08:18 (CEST)[répondre]

    Salut Evynrhud ! :)
    1) Un problème de base de donnée pour le traitement des {ouvrage}. La base est mal configurée/optimisée, et devenue trop grosse le fonctionnement bouffe trop de processeur/mémoire. Faut que je trouve le courage... 2) des petits bugs pour le traitement des {lien web}/{article} que je n'ai pas eu le temps de réparer. 3) Manque de temps à cause du boulot
    Je m'en occuperai, un jour. ;) — Irønie (d) 4 juin 2021 à 20:28 (CEST)[répondre]
    Salut Irønie,
    Merci de ta réponse et pour tes éclaircissements. Nous allons patienter tranquillement alors...Émoticône Bon courage à toi et à bientôt. Evynrhud (discuter) 4 juin 2021 à 21:01 (CEST)[répondre]
    CodexBot est de retour ! \o/
    Merci Irønie. — Thibaut (discuter) 6 juin 2021 à 20:14 (CEST)[répondre]
    Non :( juste le script de notification - Irønie (d) 6 juin 2021 à 21:08 (CEST)[répondre]

    Correction des paramètres DOI invalides[modifier le code]

    Bonjour Irønie. Puisque CodexBot a pour projet une « gestion des DOI », voici un petit signalement de formats invalides pour le paramètre doi des modèles bibliographiques : « DOI xxxx » ou « DOI :xxxx », indépendamment de la casse. Le paramètre ne doit pas contenir de préfixe mais uniquement le « xxxx ». Exemples : pour le modèle Article sur wstat.fr.
    En revanche les valeurs « doi: xxxx » ou « doi:xxxx » voire « https://doi.org/xxxx » sont fonctionnelles même si la redondance de l'affichage du terme doi est inutile (paramètre simplifiable). Penses-tu pouvoir intégrer ces petites corrections à CodexBot qui parcourt les articles ? Merci. — Ideawipik (discuter) 24 juillet 2021 à 20:32 (CEST)[répondre]

    Des informations sur Otto Gunsche[modifier le code]

    Salut, je ne sais pas si c'est la bonne façon de demander des informations, je l'espère. Il est possible de connaître le nazi Otto Gunsche la source documentée des médailles reçues. Il n'y a que sur Wikipédia français qu'il rapporte toutes ces médailles, je voulais savoir si c'est une source sûre et où vous pouvez vérifier. Merci merci

    Date de consultation[modifier le code]

    Bonjour,

    Juste une petite remarque en passant, d'un nouveau : je viens de voir (sur Marsupilami) que le robot remplace les url brutes par le beau {lienweb} avec tous ses paramètres : très bien, mais est-il pertinent de renseigner la date « consulté le » quand c'est un robot qui l'a fait ? et donc, si je comprends bien, n'est pas du tout rentré dans le contenu de la page ni dans sa signification. En fait il y a deux notions de consultation : techniquement, le robot a vérifié le jj/mm/aa que le lien existait et a récupéré les infos ; mais « sémantiquement », une personne humaine a jugé le contenu pertinent, à une date antérieure.

    Tant que j'y suis, ne vaudrait-il pas mieux présenter Levenshtein comme Soviétique plutôt que Russe, sur la PU du robot, puisque c'est en URSS qu'il a été formé et a fait l'essentiel de ses travaux ?

    Je mets la page en suivi pour voir la réponse ; bravo pour tout ce travail, bien cdt — Couleys [कुरा गरौं] 28 septembre 2021 à 08:42 (CEST)[répondre]

    Salut @Couleys.
    C'est ton interprétation personnelle du "consulté le" comme validation rédactionnelle. D'après la doc, c'est seulement "Date de consultation du document. Permet de surveiller l’obsolescence de l'URL", avec l'intérêt de retrouver l'archive quand le lien sera mort. Voir Discussion_utilisateur:CodexBot/Archive#Consulté_le. — Irønie (d) 28 septembre 2021 à 20:16 (CEST)[répondre]
    Bonjour Irønie (on va dire que je parlais au robot ce matin) et merci pour ta réponse.
    Mon interprétation personnelle, oui si on veut : disons que quand on lit un article WP en tant que simple visiteur, ou contributeur récent, on pense à un texte écrit par un humain (une succession d'humains en fait) qui a lu des sources, plus que par un robot. Merci de m'avoir indiqué la question précédente, je vois que je ne suis pas le seul. Ce n'est pas tellement au spam par les liens que je pensais, plutôt à un site qui aurait bougé depuis qu'on s'en est servi de référence et qui ne dirait plus la même chose : la date de consultation servirait de précision nécessaire.
    En fait c'est le terme « consulté » qui induit en erreur, le terme anglais « access date » est plus évident me semble-t-il. On ne peut pas dire « accédé le », ce n'est pas français, à la rigueur « accessible le » : je ne trouve pas mieux mais de toute façon je n'ai pas la prétention de faire évoluer le modèle {lienweb}.
    En tout cas je comprends mieux grâce à tes explications ; bonne continuation — Couleys [कुरा गरौं] 28 septembre 2021 à 20:30 (CEST)[répondre]
    Sur https://fr.wikipedia.org/w/index.php?title=Sujet:Vspcdv1rvcz88fyh discussion sur l'utilité et rendre invisible ce paramètre. Ou l'idée d'un nouveau paramètre "relu le".
    A+ - Irønie (d) 28 septembre 2021 à 20:36 (CEST)[répondre]
    Merci encore ! je retiens « lien valide le » (sauf que cette formulation ne prend pas en compte le cas que tu cites d'un lien techniquement valide mais qui a complètement changé). Je vois aussi que la discussion est dans l'air et que ça débouchera bien un jour, au Bistro ou ailleurs.
    En attendant, ça valide donc tes interventions de maintenance ; et ça veut dire que si on fait le travail du robot, on n'a pas forcément à lire le contenu du lien pour saisir la date du jour dans le paramètre.
    Bien cdt — Couleys [कुरा गरौं] 28 septembre 2021 à 20:59 (CEST)[répondre]
    @Couleys : Autre façon de faire (narrée par Irønie), que je ne désapprouve pas. --CodexBot (signaler erreur) 29 septembre 2021 à 13:28 (CEST)[répondre]

    "todo" liste[modifier le code]

    Bonjour. Depuis peu, les pages de discussion des articles qui ont un problème avec le modèle ouvrage portent deux signalements : Un sujet de discussion et une inscription dans la liste des "choses" à faire. Cela fait donc deux éléments à supprimer après correction. 9a pourrait être plus simple. Amicalement. - p-2021-10-s - Couarier 24 octobre 2021 à 18:13 (CEST)[répondre]

    Bonjour Paul.schrepfer,
    Si rien n'est fait pas le contributeur après correction, CodexBot se débrouille tout seul pour supprimer les signalements... Et il ne faut pas confondre les signalements de CodexBot et ceux de WikiCleanerBot. - Evynrhud (discuter) 24 octobre 2021 à 18:23 (CEST)[répondre]
    Bonjour Evynrhud, c'est quand même mieux si on corrige, ça évite à autrui de perdre du temps à chercher une erreur corrigée. Amicalement. - p-2021-10-s - Couarier 25 octobre 2021 à 08:12 (CEST)[répondre]

    site= com.au[modifier le code]

    Bonjour Irønie

    Ton bot a des problèmes pour reconnaître les adresses web : au lieu de mettre site=dailytelegraph.com.au par exemple, il met juste site=com.au (cf. [1])

    On dirait qu'il y a un problème avec les archives (la ref 30 est bonne mais l'archive ne correspond pas). On dirait que ton bot prend le titre de l'onglet de l'archive (« No Cookies / Daily Telegraph » à la place de « Miranda Kerr ex lover Adrian Camilleri jailed for fraud | Daily Telegraph »).

    Si c'est pour éviter de mettre le titre d'une page d'erreur 404 (comme la ref 31), ne vaudrait-il pas mieux ajouter un modèle {{lien brisé}} ?

    Il est tard et je ne comprends pas toute l'histoire... Je vais dodo.

    À toi de jouer, bonne chance ! Şÿℵדαχ₮ɘɼɾ๏ʁ 20 novembre 2021 à 01:03 (CET)[répondre]

    @SyntaxTerror Ok, 2 problèmes :
    1. Le nom de domaine .au n'est pas libre et régit par sous-sous-domaine comme quelques autres pays (Maroc, Corée, etc). Faut que je corrige ça. J'ai jamais trouvé de liste des nom de domaines dans ce genre, donc j'ai dû composer à la main.
    2. "No Cookies / Daily Telegraph" c'est le titre Html (et la méta-donnée "description") quand un bot ou une app consulte le site. Bref, le site est mal codé. Seule solution, bannir le Dailytelegraph du traitement par le bot.
    Merci du signalement. - Irønie (d) 20 novembre 2021 à 15:30 (CET)[répondre]
    Pour une liste, tu peux regarder ici : https://publicsuffix.org/list/ .
    Tu peux aussi chercher sur stackoverflow, ou même poser la question là-bas, il y a pas mal de questions à propos de ça [2], [3], [4], [5], etc.
    Sinon, tu devrais regarder ReFill, un gadget qui permet de remplir le modèle {{Lien web}} à partir d'adresses web (c'est codé en PHP). J'avais aidé à sa traduction pour wp.fr, mais je ne sais pas s'il fonctionne encore bien.
    Cordialement, Şÿℵדαχ₮ɘɼɾ๏ʁ 20 novembre 2021 à 18:10 (CET)[répondre]
    @SyntaxTerror : Merci pour les pistes et liens, c'est super sympa :)
    Je verrai ensuite pour corriger les {Lien web} erronés. - Irønie (d) 20 novembre 2021 à 21:08 (CET)[répondre]