Utilisateur:CodexBot/old

Une page de Wikipédia, l'encyclopédie libre.

dessin robot CodexBot (edits, edits2) + ZiziBot (edits)DiscussionsFAQSondagesMonitoring • Configuration : sites externesdomain banISBNvilles

CodexBot sur la piste d'un ouvrage
CodexBot sur la piste d'un ouvrage


Je vérifie • corrige et complète les mentions bibliographiques sur Wikipédia • en corrigeant les erreurs (typo • confusion de paramètres • respect des conventions) et en ajoutant des informations manquantes (langue du livre • éditeur • lien vers livre numérisé • etc) ; d'après un ensemble de règles • des prédictions statistiques ou des données extraites de bases de données bibliographiques : notamment Open Library (OL) • Google Livres (GB) • Bibliothèque nationale de France (BnF) • Wikidata (WD) • International ISBN Agency.

Au final • la mention basique Le bruit et la fureur (ISBN 9782070361625) sera transformée en :
William Faulkner (trad. de l'anglais), Le Bruit et la Fureur [« The sound and the fury »], Paris, Gallimard, coll. « Folio », , 371 p. (ISBN 978-2-070-36162-5, lire en ligne).

Ou bien la référence <ref>https://books.google.fr/books?id=VvFcAAAAcAAJ&pg=PA508</ref> est transformée en :
Louis Moréri, Le grand dictionnaire historique ou le mélange curieux de l'histoire sacrée et profane, , 944 p. (lire en ligne), p. 508.

Je remplace également les liens externes (http://) par des références complètes (auteur, titre d'article, date) pour des centaines de journaux scientifiques, de sites de presse, etc. Exemple : https://www.lemonde.fr/planete/article/2020/07/22/le-contact-tracing-a-l-epreuve-de-la-realite_6046893_3244.html est transformé en :
Chloé Hecketsweiler, « Coronavirus : des lenteurs dans le traçage des contacts de malades », Le Monde,‎ (lire en ligne, consulté le )

Je signale également en page discussion les incohérences et erreurs détectées [1](environ 30/jour), pour que celles-ci puissent être corrigées par des humains. Le premier passage visait presque 1 million de citations, traités en un an et demi. Ce traitement est complété par le bot ZiziBot pour les tâches expérimentales.

Chaque jour, j'analyse environ 2500 citations de livres, j'en améliore/complète environ 1500 {{ouvrage}} sur Wikipédia et j'ajoute environ 60 liens vers des livres numérisés. Chaque jour je convertis plus de 1000 adresses http:// en jolies références {{article}} (presse, scientifique) ou {{lien web}}.

🔔 Vous pouvez m'appeler avec une notification : en ajoutant par exemple appel [[User:CodexBot|CodexBot]] dans un commentaire d'édition ou dans un message sur la page discussion d'un l'article.

Pour signaler un bug, une idée ou autre : page discussion.

Tâches[modifier | modifier le code]

dessin robot
15-04-2023
Progression : La moissonneuse-batteuse CodexBot tourne fort, mais le champ est immense.
  • Un résumé commençant par « bot » signale un édition n'apparaissant pas dans les listes de suivi. signale une prédiction ou un ajout de donnée qui demande une vérification humaine. signale un problème.
  • Le bot n'intervient pas si un humain a édité l'article dans les dernières 15 minutes.
  • Le bot ne touche pas aux citations qui contiennent un commentaire invisible. Par exemple <!-- Pour empêcher CodexBot d'intervenir -->.
  • Pour empêcher le bot d'intervenir sur un article (ou une page quelconque), ajouter {{bots|deny=CodexBot}}

Ton cerveau humain serait utile pour corriger les erreurs que j'ai détecté.

2 pages à traiter

Le bot est composé de processus indépendants (workers)

Statistiques[modifier | modifier le code]

Décembre-mars 2020, 60'000 articles analysés (70% édités) :

  • Ajout de 11'000 liens vers des livres numérisés (14% des edits)
  • Ajout de 5'000 sous-titre (9% des edits)
  • 6'000 ajouts 'langue originale' (8% des edits)
  • 22'000 ajout 'lieu' d'édition (31% des edits)
  • 50'000 ajout 'pages totales' (55% des edits)
  • 5'000 distinctions des auteurs multiples
  • 3'000 prédictions sur paramètre erroné (éiteur⇒éditeur)
  • 2'500 articles signalés avec erreurs (6% des edits) : la moitié déjà corrigés par humains
  • En mars : environ 1000 références "URL brute" converties en {ouvrage} (exemple). 3000 en {Article} (exemple)

Sinon sur Wikipédia c'est :

  • +12'000 ajouts {ouvrage} par mois (400/jour)
  • +9'000 {article} par mois ?
  • Plus de 1 millions de {ouvrage} début 2021

Fonctions en projet[modifier | modifier le code]

Les expérimentations sont réalisées avec le bot ZiziBot.

  • Conversion de citations textuelles en modèle (exemple)
  • Gestion étendue des liens morts (404, remplacement par lien Internet Archive)
  • Vérification/complétion des {article} et {lien web}
  • Gestion des DOI (titre, url alternative, accès url)
  • Transcription du cyrillique (russe) : Борис Томашевский, Россия, 2002 transformé en Boris Tomaševskij, Russie [Россия], 2002
  • Export des citations biblio vers WikiData.

Liens[modifier | modifier le code]

Surveillance des correctifs humains sur mentions biblioDépôt GithubTrelloPage ToolForgeSignalementsTraduction FR noms de ville (à compléter!) • Mémo juridique

Dernières éditions[modifier | modifier le code]

26 avril 2024

25 avril 2024

Notifications +[modifier | modifier le code]

Dernières notifications du bot :

Monitoring +[modifier | modifier le code]

Dernières corrections humaines sur citations après passage du bot :

modifiéédit bothistoriquetitre de l'articleversion
du bot
20 %27-05-2023histoCretoxyrhina2.0
33 %29-04-2023histoStatistiques sur l'immigration en France1.1
5 %29-04-2023histoMarcien1.1
6 %29-04-2023histoHistoire de la Corée1.1
6 %29-04-2023histoHistoire de la Corée1.1
62 %29-04-2023histoGravures de Rembrandt1.1
14 %29-04-2023histoAutoportraits de Rembrandt1.1
41 %22-04-2023histoIda B. Wells1.1
100 %22-04-2023histoAkira Kurosawa1.1
13 %10-04-2023histoHenri de Grosmont1.0
2 %07-04-2023histoHaroun Tazieff1.0
4 %07-04-2023histoSorraia1.0
3 %07-04-2023histoAubère1.0
2 %07-04-2023histoMaurice (empereur)1.0
67 %07-04-2023histoMaison Mattot1.0
63 %07-04-2023histoEdgar Kain1.0
6 %07-04-2023histoVal d'Anniviers1.0
7 %06-04-2023histoAirbus A3101.0
11 %06-04-2023histoApsley Cherry-Garrard1.0
13 %06-04-2023histoElwood Haynes1.0
1 %06-04-2023histoFrancis Jammes1.0
5 %06-04-2023histoPrestation de serment des rois des Belges1.0
9 %06-04-2023histoLac Lalolalo1.0
8 %06-04-2023histoSkyros (cheval)1.0
6 %06-04-2023histoÉquipe d'Irlande du Nord de football à la Coupe du monde 19581.0
8 %06-04-2023histoMosaïque du cirque de Carthage1.0
11 %06-04-2023histoNécropole des Rabs1.0
20 %06-04-2023histoConcert des Beatles sur le toit1.0
8 %06-04-2023histoEraserhead1.0
5 %05-04-2023histoAlauna1.0
11 %05-04-2023histoTrompette de Gabriel1.0
40 %05-04-2023histoPièce de 1 dollar américain Susan B. Anthony1.0
7 %05-04-2023histoZénon (empereur byzantin)1.0
4 %05-04-2023histoBasiliscus1.0
11 %12-02-2023histoNicéphore II Phocas1.0
69 %12-02-2023histoMulholland Drive (film)1.0
20 %12-02-2023histoAutorail Pauline1.0
3 %11-02-2023histoBertrand Russell1.0
50 %11-02-2023histoCuphead1.0
6 %11-02-2023histoGeneralplan Ost1.0
7 %11-02-2023histoCheval en Jamaïque1.0
17 %11-02-2023histoLudwig Wittgenstein1.0
33 %11-02-2023histoDébuts de l'écriture en Mésopotamie1.0

Pourcentage de citations modifiées. Date du passage bot. Certaines corrections humaines ne sont pas listées (typo majuscule/minuscule, correction suite à signalement du bot).

Le saviez-vous ?[modifier | modifier le code]

Si le nombre d'articles de la Wikipédia en français a doublé entre 2010 et 2019, le nombre de citations bibliographiques a peut-être été multiplié par 20 ! Par exemple • le nombre de modèle {ouvrage} est passé de 45 000 vers 2011 à 930 000 fin 2019.

Le mathématicien russe Vladimir Levenshtein (1939-2017) a conçu en 1965 un calcul de distance entre des chaînes de caractères, qui est utilisé par le bot pour corriger les fautes de typo dans le nom des paramètres.

Articles avec le plus grand nombre de modèles {ouvrage} :

  1. Aventures et Passions : 973
  2. Bibliographie sur l'Union européenne : 789
  3. Bibliographie sur le département de l'Aveyron : 546

Donuts[modifier | modifier le code]

Contributeurs[modifier | modifier le code]

De nombreux contributeurs ont aidé à la conception du bot, notamment Evynrhud et Ypirétis. Avec les idées et signalements de bugs de : Pierre cb, Frédéric-FR, Hégésippe, Okhjon, Herr Satz, Arroser, Dfeldmann, RSVartanian, Éduarel, TwoWings, HB, Sijysuis, Cheep, NicoV, Kokonino, Ça va sans l'dire, Le Silure, TED, VegaPic-Sou, Daehan, Cortomaltais, Verbex, Ideawipik, (:Julien:), Vers75, Kokonino, Msbbb, Epok, 103.251.44.162, Eru, Thibaut120094, Kikuyu3, SyntaxTerror.

Pensée pour les wikignomes qui corrigent suite aux signalements du bot, notamment Paul S..

Témoignages[modifier | modifier le code]

Récompense À ZiziBot et CodexBot pour leur travail sur les références.
Xav [talk-talk] 7 juin 2020 à 14:59 (CEST)

Liens[modifier | modifier le code]

Memo[modifier | modifier le code]

Inspi : titres de pages par Google :