Utilisateur:ZiziBot/features

Une page de Wikipédia, l'encyclopédie libre.

dessin robot CodexBot (edits, edits2) + ZiziBot (edits)DiscussionsFAQSondagesMonitoring • Configuration : sites externesdomain banISBNvilles

Légende : ✔️ module activé / ❌ module pas activé / ! Attendre (consensus)

Traitement modèle {Ouvrage}[modifier | modifier le code]

Correction syntaxique des paramètres :

  • ✔️ correction des alias [invisible]
  • ✔️ conversion des paramètres enwiki ({{cite book}}) [invisible]
  • ✔️ correction de paramètres inconnus (prédiction) : erreur de frappe [1]
  • ✔️ signalement paramètre inconnu : commentaire HTML [2] ✔️ message en page discussion [3]
  • ✔️ extraction paramètres obsolètes (plume,extrait,commentaire) vers {plume},{{citation bloc}},{{commentaire biblio}}, {{début citation}}... [invisible]

Style : conservation partielle du style rédactionnel du modèle : ❌ ordre des paramètres, ✔️ espacement/retour ligne, ❌ noms de paramètre. [4]

Complètement de données d'après des bases bibliographiques :

  • recherche par ✔️ISBN, ✔️ lien Google, ❌ auteur+titre
  • Bases interrogées : ✔️ Google Books, ✔️ Open Library, ✔️BnF, Tête de mortWorldCat,✔️WikiData
  • todo: décrire fiabilité données
  • ✔️ comparaison titre/auteur pour fiabilité infos
  • Exemple : [5]
  • Wikidata : wikiliens vers auteur (d'après ISNI/VIAF) et titre ouvrage (ISBN)

Améliorations typographiques :

Titre, sous-titre...

  • ✔️ Typo : majuscules, règle internationale " : " (bistro 08-2019)
  • ✔️retire lien externe titre/sous-titre (Bistro 27 août 2011)
  • ✔️retire {{lang}} : déplacé vers 'langue' [invisible]
  • ✔️ déplacement en 'sous-titre' [invisible]

Autres :

  • ✔️ pas de wikilien sur 'lieu' (stats/pertinence) : Paris -> Paris
  • ✔️correction des confusions 'pages totales/passage' (prédiction).
  • ✔️correction des confusions 'numéro chapitre'/'titre chapitre', etc
  • ✔️ complétion sous-titre exemple

Auteur :

  • ! Attendre Prénom1+Nom1=>Auteur1 (si prénom/nom uniques ou prénom avec initiale) [invisible]
  • ! Attendre distinction prénom/nom si 2 prénoms (ancrage).
  • ✔️ distinction auteurs multiples [6]
  • ✔️ ajout wikilien page d'auteur

Editeur :

  • ✔️ 'lien éditeur' (obsolète) remplacé par wikilien [invisible]
  • ! Attendre correction typographique : abbréviations du genre "(Éd.)"
  • ! Attendre forme brève : Éd. de La Gourde => La Gourde, mais 'Éditions de Minuit' inchangé
  • ✔️ ajout du wikilien éditeur

Lieu :

  • ✔️ francisation des villes : London->Londres voir liste
  • ✔️ suppression wikilien : Londres->Londres

ISBN :

  • ✔️ conversion EAN (sans tiret) et ISBN-10 => ISBN-13 ([7])
  • ✔️ ISBN-10 archivé dans 'isbn10' (non affiché)
  • ✔️ signalement ISBN invalide (checksum, code pays/product) : commentaire HTML et 'isbn invalide=' + message PD
  • ❌ contrôle des ISBN multiples (isbn2, isbn3)

Dates :

  • ✔️ confusion date/année [invisible]
  • ❌ typo et conversions dates américaines
  • ! Attendre Avec LUA plus besoin d'exploser la date en jour/mois/année. Faut-il convertir vers 'date' ?

Format :

  • ✔️ prédiction 'format livre' ou 'format électronique'

Lien vers Google Books :

  • Wikipédia:Le_Bistro/15_octobre_2019#Liens_Google_Livres Bistro
  • ✔️ simplification d'URL : ✔️suppression des paramètres non nécessaires (infos de tracking) : conservation id, pg (page), dq (requête/surlignage) qui permettent d'obtenir la même interface.[cosmétique??]
  • ! Attendre Suppression lien invalide (id manquant)
  • ✔️ dans {{Ouvrage}} : correction 'lire en ligne'/'présentation en ligne' selon accessibilité totale ou partielle du document. [8]
  • ✔️ conversion en {{Google Livres}} [9]
  • ✔️ ajout lien Google si livre d'accès complet.
  • ✔️ ajout lien Google présentation en ligne [10]
  • ✔️ ajout 'lire en ligne' si livre d'accès partiel.

Lien vers Internet Archive :

  • ✔️ ajout 'lire en ligne' vers livre numérisé (accès libre ou empruntable)
  • ❌ privilégier lien vers IA plutôt que Google

Fonctionnement du bot :

  • ✔️ n'édite pas si correction invisible
  • ✔️ édit sans botflag si ajout de donnée substantiel (auteur,sous-titre...) ou prédiction incertaine
  • ✔️ arrêt si modification page discussion du bot
  • ✔️ ne traite pas les modèles contenant du commentaire HTML <!-- blabla -->
  • respecte les limitations {{nobots}} et {{bots}}
  • ❌ suivi des reverts (apprentissage)

Sur page globale :

  • ✔️ déplacement de la mention langue à l'intérieur du modèle [11]
  • ✔️ pas d'intervention si édition humaine y'a moins de 15 minutes
  • ✔️ provisoirement pas d'intervention sur AdQ/BA
  • ❌ analyse des {fr}, {en} pour ajout {fr} si ouvrages étrangers > 50%
  • ✔️ Message en PD pour ISBN invalide, suggestion de correctifs, etc. Par le passé, succès/efficacité.
  • ❌ un seul wikilien identique par page

Estimation[modifier | modifier le code]

Durée tâche :

  • 9 mois pour {ouvrage} avec ISBN (~200 edits/j, 10/h) 170'000
  • 2 ans pour {ouvrage} sans ISBN / 920'000 inclusions
  • Avec les limitations API Google, le bot analyse maximum 1000 citations/jour
  • Le bot ne devrait pas repasser sur un article avant 1 an

Dans sa version ancienne, suite aux édits du bot, y'avait environ 1% de modification humaine des citations. Les 2/3 portant sur la correction d'ISBN ou titres signalés erronés par le bot (genre message en PD).

Mentions libres de biblio (hors modèles)[modifier | modifier le code]

  • ! Attendre simplification d'URL Google Livres (paramètres de tracking)
  • ! Attendre possibilité de conversion en {{Google Livres}} mais pas de consensus.
  • ❌ conversion en {{ouvrage}}
  • ❌ ajouts de données d'après bases biblio