Utilisateur:ZiziBot

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Signalez les erreurs du robot et les suggestions d'amélioration... sur cette page

Requête démarrée puis mise en instance En pause depuis 27 mai 2012 : Conversion bibliographique de {{cite book}} ██████████40 % (attente Toolserver)
Requête démarrée puis mise en instance En pause depuis 27 mai 2012 : Traitement bibliographique de {{ouvrage}}. ██████████15 % (attente Toolserver)


Tablo-zizibot2.gif

Bonjour ! Je suis un robot contrôlé par l'humain Irønie. Je fonctionne de manière automatique ou sous supervision humaine. Mes modifications d'article sont visibles ou masquées (bot flag) selon la nature de mes envies.

孜孜 zīzī (prononcé « tseutseu ») signifie « assidu, industrieux, diligent » en chinois.

Je suis programmé en PHP-SQL (exploitation dumps et API) et dédié particulièrement à l'importation de données ouvertes, la fouille de textes, et secondairement à des remplacements massifs (modèles, catégories). Mes projets de tâches :

  • traitement des langues chinoises (correction/suggestion, pinyin, segmentation, modèles, traduction)
  • traitement bibliographique (vérification/complètement/suggestion de références, application des modèles)
  • Interface web pour usage facile par les contributeurs

La communauté Wikipédia a autorisé mon fonctionnement (pour tâches de remplacement) en novembre 2007 (vérifier). Des autorisations seront demandées pour mes nouvelles tâches, si celles-ci semblent originales ou potentiellement contestables.

Administrateurs : Si je fonctionne mal ou si je m'amuse à détruire des articles, prière de me couper en utilisant les ciseaux ou en laissant un message en PD.
Contributeurs : Vous pouvez rapporter mes erreurs sur ma page discussion, ou bien vous plaindre de moi sur Wikipédia:Requête aux administrateurs.

Description[modifier | modifier le code]

Le bot sera disponible en licence libre, une fois le code nettoyé. Le bot interroge notamment les bases de données bibliographiques WorldCat, ISBNdb, Gallica, les dictionnaires CFDICT et CEDICT. Certains bouts de code sont inspirés des trucs de MartinS (Citation bot) et Magnus Manske, et utilise botclasses.php (compatible FR) comme base.

Sous-pages : Mémo juridique • Derniers éditsLogs 2012Log du jour (toutes les 4h) • Suivi des ajouts ouvrage avec ISBN invalideListe d'éditeurséditeurs 2Le blog du botSuivi modèles biblioCatégorie:Modèle pour bibliographie (suivi) • script de Lgd pour vérification des références

Traitement bibliographique[modifier | modifier le code]

Vérification, correction et complètement des mentions bibliographiques dans les articles. Notamment le traitement des modèles : Fait {{ouvrage}}, Fait {{cite book}}, Un carré gris et trois carrés oranges {{Chapitre}}, Deux carrés gris et deux carrés violets {{Article}}, Trois carrés gris et un carré marron {{ISBN}}

  • Traitement de bases bibliographiques externes. Vérification et importation ISBN, OCLC, ISSN, Deux carrés gris et deux carrés violets vérification liens externes, identification des langues... Par exemple, le bot ajoute des auteurs manquants, l'éditeur, l'année d'édition... Projet : doi, pubmed, jstor, etc. exemple
  • Fouille de wikipédia (dumps) : recherche des articles d'éditeur, auteur... en analysant les catégories et le texte des articles. Par exemple, pour "éditeur=Columbia" le bot suggère Université de Columbia après avoir fouillé 50 articles.
  • Cosmétique et remplacement : conversion date, redirections, ref manquante...

Pour résumer... à partir de la mention d'un livre par un contributeur « Badiou, Antiphilosophie de Wittgenstein » l'ambition du bot est de la transformer en :
Alain Badiou, (notes Aimé Thiault, rédac. François Duvert), L'Antiphilosophie de Wittgenstein, Caen, Nous, coll. « Antiphilosophique », , 5e éd. (1re éd. 1993), 154 p., relié et numérique (ISBN 978-2913-54905-0, présentation en ligne)

Mindmap zizi.jpg

Fonctionnalités en projet :

  • Fait Détection/analyse des révocations humaines de ses propres éditions
  • Trois carrés gris et un carré marron Suivi des ajouts de mentions bibliographiques
  • Trois carrés gris et un carré marron Interface web permettant à des cerveaux humains de sélectionner certaines corrections à réaliser (titre incorrect, propositions du bot)
  • Deux carrés gris et deux carrés violets Détection et conversion des mentions bibliographiques libres (hors modèle)
  • Un carré gris et trois carrés oranges Statistiques
  • Quatre carrés gris Analyse des liens externes (cassé, titre de page, identifiant Google books-BNF...)

Voir aussi[modifier | modifier le code]

Traitement du chinois[modifier | modifier le code]

Le bot possède un lexique de 200 000 mots chinois (CFDICT). Il pourra faire des correction/remplacement/suggestion sur les caractères chinois, les traductions, le pinyin. Fonction de segmentation. Projet gestion {{chinois}}, {{sinogramme}}.

Pour résumer, à partir de la mention dans une introduction « Guangzhou (chinois : 广州) » l'ambition du bot serait de transformer en « Guangzhou (chinois simplifié : 广州 ; chinois traditionnel : 廣州 ; pinyin : guǎngzhōu ; cantonais Jyutping : Gwong²zau¹) ».

Remplacements[modifier | modifier le code]

Des fonctions classiques de remplacements massifs (modèles, catégories).

  • Traitement des Infobox par templates.
  • Un carré gris et trois carrés oranges Fonctions pour projet maritime (infobox, vérification des ports...)