Utilisateur:CodexBot

    Une page de Wikipédia, l'encyclopédie libre.

    Robot icon.svg CodexBot (edits) + ZiziBot (edits)DiscussionsFAQSondageMonitoring • Configuration : sites externesdomain banISBNvilles

    CodexBot sur la piste d'un ouvrage
    CodexBot sur la piste d'un ouvrage


    Je vérifie • corrige et complète les mentions bibliographiques sur Wikipédia • en corrigeant les erreurs (typo • confusion de paramètres • respect des conventions) et en ajoutant des informations manquantes (langue du livre • éditeur • lien vers livre numérisé • etc) ; d'après un ensemble de règles • des prédictions statistiques ou des données extraites de bases de données bibliographiques : notamment Open Library (OL) • Google Livres (GB) • Bibliothèque nationale de France (BnF) • Wikidata (WD) • International ISBN Agency.

    Au final • la mention basique Le bruit et la fureur (ISBN 9782070361625) sera transformée en :
    William Faulkner (trad. de l'anglais), Le Bruit et la Fureur [« The sound and the fury »], Paris, Gallimard, coll. « Folio », , 371 p. (ISBN 978-2-070-36162-5, lire en ligne).

    Ou bien la référence <ref>https://books.google.fr/books?id=VvFcAAAAcAAJ&pg=PA508</ref> est transformée en :
    Louis Moréri, Le grand dictionnaire historique ou le mélange curieux de l'histoire sacrée et profane, , 944 p. (lire en ligne), p. 508.

    Je remplace également les liens externes (http://) par des références complètes (auteur, titre d'article, date) pour des centaines de journaux scientifiques, de sites de presse, etc. Exemple : https://www.lemonde.fr/planete/article/2020/07/22/le-contact-tracing-a-l-epreuve-de-la-realite_6046893_3244.html est transformé en :
    Chloé Hecketsweiler, « Coronavirus : des lenteurs dans le traçage des contacts de malades », Le Monde,‎ (lire en ligne, consulté le )

    Je signale également en page discussion les incohérences et erreurs détectées [1](environ 30/jour), pour que celles-ci puissent être corrigées par des humains. Le premier passage visait presque 1 million de citations, traités en un an et demi. Ce traitement est complété par le bot ZiziBot pour les tâches expérimentales.

    Chaque jour, j'analyse environ 2500 citations de livres, j'en améliore/complète environ 1500 {{ouvrage}} sur Wikipédia et j'ajoute environ 60 liens vers des livres numérisés. Chaque jour je convertis plus de 1000 adresses http:// en jolies références {{article}} (presse, scientifique) ou {{lien web}}.

    🔔 Vous pouvez m'appeler avec une notification : en ajoutant par exemple appel [[User:CodexBot|CodexBot]]​ dans un commentaire d'édition ou dans un message sur la page discussion d'un l'article.

    Pour signaler un bug, une idée ou autre : page discussion.

    Tâches[modifier | modifier le code]

    Progression : La moissonneuse-batteuse CodexBot tourne fort, mais le champ est immense.
    • Un résumé commençant par « bot » signale un édition n'apparaissant pas dans les listes de suivi. signale une prédiction ou un ajout de donnée qui demande une vérification humaine. signale un problème.
    • Le bot n'intervient pas si un humain a édité l'article dans les dernières 15 minutes.
    • Le bot ne touche pas aux citations qui contiennent un commentaire invisible. Par exemple <!-- Pour empêcher CodexBot d'intervenir -->​.
    • Pour empêcher le bot d'intervenir sur un article (ou une page quelconque), ajouter {{bots|deny=CodexBot}}​

    Ton cerveau humain serait utile pour corriger les erreurs que j'ai détecté.

    1 pages à traiter

    Le bot est composé de processus indépendants (workers)

    Statistiques[modifier | modifier le code]

    I love templates hexagon.png

    Décembre-mars 2020, 60'000 articles analysés (70% édités) :

    • Ajout de 11'000 liens vers des livres numérisés (14% des edits)
    • Ajout de 5'000 sous-titre (9% des edits)
    • 6'000 ajouts 'langue originale' (8% des edits)
    • 22'000 ajout 'lieu' d'édition (31% des edits)
    • 50'000 ajout 'pages totales' (55% des edits)
    • 5'000 distinctions des auteurs multiples
    • 3'000 prédictions sur paramètre erroné (éiteur⇒éditeur)
    • 2'500 articles signalés avec erreurs (6% des edits) : la moitié déjà corrigés par humains
    • En mars : environ 1000 références "URL brute" converties en {ouvrage} (exemple). 3000 en {Article} (exemple)

    Sinon sur Wikipédia c'est :

    • +12'000 ajouts {ouvrage} par mois (400/jour)
    • +9'000 {article} par mois ?
    • Plus de 1 millions de {ouvrage} début 2021

    Fonctions en projet[modifier | modifier le code]

    Les expérimentations sont réalisées avec le bot ZiziBot.

    • Conversion de citations textuelles en modèle (exemple)
    • Gestion étendue des liens morts (404, remplacement par lien Internet Archive)
    • Vérification/complétion des {article} et {lien web}
    • Gestion des DOI (titre, url alternative, accès url)
    • Transcription du cyrillique (russe) : Борис Томашевский, Россия, 2002 transformé en Boris Tomaševskij, Russie [Россия], 2002
    • Export des citations biblio vers WikiData.

    Liens[modifier | modifier le code]

    Surveillance des correctifs humains sur mentions biblioDépôt GithubTrelloPage ToolForgeSignalementsTraduction FR noms de ville (à compléter!) • Mémo juridique

    Dernières éditions[modifier | modifier le code]

    2 juillet 2022

    29 juin 2022

    28 juin 2022

    27 juin 2022

    26 juin 2022

    25 juin 2022

    23 juin 2022

    19 juin 2022

    13 juin 2022

    10 juin 2022

    9 juin 2022

    6 juin 2022

    5 juin 2022

    4 juin 2022

    2 juin 2022

    29 mai 2022

    28 mai 2022

    27 mai 2022

    26 mai 2022

    23 mai 2022

    Notifications +[modifier | modifier le code]

    Dernières notifications du bot :

    Monitoring +[modifier | modifier le code]

    Dernières corrections humaines sur citations après passage du bot :

    modifiéédit bothistoriquetitre de l'articleversion
    du bot
    20 %24-10-2021histoConvention constitutionnelle au Canada1.0
    33 %24-10-2021histoConstantine d'Osroène1.0
    9 %24-10-2021histoConseil international des femmes1.0
    9 %24-10-2021histoConseil international des femmes1.0
    20 %24-10-2021histoConrad II de Bohême1.0
    100 %24-10-2021histoConquête musulmane de la Perse1.0
    14 %24-10-2021histoConquête de la Tunisie par la France1.0
    100 %24-10-2021histoConnie Matthews1.0
    50 %24-10-2021histoConjecture abc1.0
    20 %24-10-2021histoConférence Byurakan1.0
    25 %24-10-2021histoConception (construction)1.0
    33 %24-10-2021histoConnad Cerr1.0
    33 %24-10-2021histoConall mac Comgaill1.0
    33 %24-10-2021histoConall Crandomna1.0
    14 %08-10-2021histoComté de Meath1.0
    20 %08-10-2021histoComté de Champagne1.0
    7 %07-10-2021histoCompétences coloniales de la Cour de cassation belge1.0
    33 %07-10-2021histoComposé organoboré1.0
    100 %07-10-2021histoComplexité en moyenne des algorithmes1.0
    7 %03-10-2021histoAlain Charre1.0
    50 %03-10-2021histoMonastère de Sighisoara1.0
    1 %03-10-2021histoOmelette1.0
    50 %03-10-2021histoDe re coquinaria1.0
    25 %03-10-2021histoLaurence Deonna1.0
    7 %03-10-2021histoMariano Navarro Rubio1.0
    7 %03-10-2021histoAdrien Romain1.0
    33 %03-10-2021histoAdélaïde Valentin1.0
    7 %03-10-2021histoAl-Andalus1.0
    8 %03-10-2021histoHans Asperger1.0
    3 %03-10-2021histoScience et ingénierie de Léonard de Vinci1.0
    50 %02-10-2021histoChef-d'œuvre1.0
    25 %02-10-2021histoChaussée romaine de Bavay à Cologne1.0
    50 %18-05-2021histoCharles de Birague1.0
    67 %16-05-2021histoCharles H. Crane1.0
    6 %15-05-2021histoCharles Darwin1.0
    50 %15-05-2021histoCharles Brault1.0
    100 %15-05-2021histoChapelle de la Madeleine (Saint-Émilion)1.0
    100 %15-05-2021histoChapelle de Saint-Paul de Taganrog1.0
    15 %15-05-2021histoChanson italienne1.0
    43 %15-05-2021histoChampignon pathogène1.0
    50 %15-05-2021histoChamp de blé derrière l'hospice Saint-Paul avec un faucheur1.0
    50 %15-05-2021histoChambre de la musique du Reich1.0
    25 %15-05-2021histoChaman1.0
    100 %15-05-2021histoChaffee (Dakota du Nord)1.0
    50 %15-05-2021histoCeux qui servent en mer1.0
    100 %15-05-2021histoCette sacrée jeunesse1.0
    50 %15-05-2021histoCerinthe major1.0
    100 %14-05-2021histoCephalanthera longibracteata1.0
    8 %14-05-2021histoCentre d'extermination de Sobibór1.0
    6 %14-05-2021histoCentre d'extermination de Bełżec1.0
    25 %14-05-2021histoCentrales pour l'émigration juive1.0
    33 %14-05-2021histoCellach mac Fáelchair1.0
    50 %14-05-2021histoCathédrale Saint-Louis de Carthage1.0
    100 %14-05-2021histoCatherine Coquery-Vidrovitch1.0
    25 %14-05-2021histoCathal mac Ruaidhrí1.0
    15 %14-05-2021histoCastor fiber1.0
    25 %14-05-2021histoCas d'espionnage de Zhao Jianmin1.0
    50 %14-05-2021histoCarré unité1.0
    20 %14-05-2021histoCarrelage1.0
    14 %14-05-2021histoCarreau ciment1.0

    Pourcentage de citations modifiées. Date du passage bot. Certaines corrections humaines ne sont pas listées (typo majuscule/minuscule, correction suite à signalement du bot).

    Le saviez-vous ?[modifier | modifier le code]

    Si le nombre d'articles de la Wikipédia en français a doublé entre 2010 et 2019, le nombre de citations bibliographiques a peut-être été multiplié par 20 ! Par exemple • le nombre de modèle {ouvrage} est passé de 45 000 vers 2011 à 930 000 fin 2019.

    Le mathématicien russe Vladimir Levenshtein (1939-2017) a conçu en 1965 un calcul de distance entre des chaînes de caractères, qui est utilisé par le bot pour corriger les fautes de typo dans le nom des paramètres.

    Articles avec le plus grand nombre de modèles {ouvrage} :

    1. Aventures et Passions : 973
    2. Bibliographie sur l'Union européenne : 789
    3. Bibliographie sur le département de l'Aveyron : 546

    Donuts[modifier | modifier le code]

    Contributeurs[modifier | modifier le code]

    De nombreux contributeurs ont aidé à la conception du bot, notamment Evynrhud et Ypirétis. Avec les idées et signalements de bugs de : Pierre cb, Frédéric-FR, Hégésippe, Okhjon, Herr Satz, Arroser, Dfeldmann, RSVartanian, Éduarel, TwoWings, HB, Sijysuis, Cheep, NicoV, Kokonino, Ça va sans l'dire, Le Silure, TED, VegaPic-Sou, Daehan, Cortomaltais, Verbex, Ideawipik, (:Julien:), Vers75, Kokonino, Msbbb, Epok, 103.251.44.162, Eru, Thibaut120094.

    Pensée pour les wikignomes qui corrigent suite aux signalements du bot, notamment Paul S..

    Témoignages[modifier | modifier le code]

    Récompense À ZiziBot et CodexBot pour leur travail sur les références.
    Xav [talk-talk] 7 juin 2020 à 14:59 (CEST)

    Liens[modifier | modifier le code]

    Memo[modifier | modifier le code]

    Inspi : titres de pages par Google :