Projet:Communes de France/VBA/Intro

Une page de Wikipédia, l'encyclopédie libre.

Le présent article vise à introduire un tutoriel de VBA, une implémentation de Microsoft Visual Basic intégrée dans toutes les applications de Microsoft Office, et, en particulier dans le cas qui nous intéresse, à Microsoft Excel, dans la perspective d'améliorer les articles des divisions françaises dans Wikipédia, et en particulier les articles des communes de France.

Principe : la progressivité[modifier | modifier le code]

L'idée est la progressivité.

  • d'abord apprendre à manipuler des données et créer des listes, tableaux ou palettes ;
  • puis à générer du texte sous forme de phrases ou de paragraphes, avec des références ;
  • puis à générer des sections entières intégrant texte, listes, tableaux ou autres éléments que l'on trouve habituellement dans les articles de WP.

Chaque exemple sera dédié à un cas particulier que l'on peut rencontrer dans les articles de divisions françaises.

Noter que les codes qui seront diffusés pourront être utilisés par n'importe quel utilisateur, même s'il ne s'est pas spécialement intéressé au tuto. Par exemple, en un clic tout utilisateur pourra générer la section "communes limitrophes", avec toutes les distances et tous les noms de communes wikifiés. Libre à l'utilisateur de le coller ensuite ou non à l'emplacement voulu de l'article concerné. Ce n'est qu'un exemple bien entendu.

Pour commencer, il faut bien entendu absorber quelques tutos, pour assimiler les bases du VBA. En voici deux :

  • Excel pratique ;
  • Manipuler les chaînes de caractères - essentiel. Car le principe de nos interventions sera de récupérer le contenu d'un modèle ou d'un article sous forme d'une immense chaîne de caractères que l'on manipule ensuite, puis que l'on recharge sur Wikipédia.

Noter que pour ce que l'on souhaite faire, à savoir intervenir sur les articles de Wikipédia, on n'a pas besoin d'être un expert en VBA, mais connaitre uniquement les manipulations et autres traitements nécessaires à ce que l'on veut obtenir. De la même manière que récupérer à la volée des données sur une page web (pas une base de données), se fera toujours de la même manière (et cela ne s'invente pas!).

Le plan ci-après sera complété au fur et à mesure de la création des articles.

Utiliser une base de données structurées[modifier | modifier le code]

Le bot travaille ici à partir de tables Excel, issues de bases de données structurées téléchargées (en .dbf, .csv ou simplement en .xls)

  • Listes
  • Tableaux
  • Palettes
  • Textes

Utiliser des données récupérées à la volée sur le web[modifier | modifier le code]

Le bot travaille ici à partir de données récupérées à la volée sur des pages web. Il faut savoir en particulier s'affranchir des informations parasites qui peuvent venir perturber la récupération, comme l'affichage de bandeaux divers (pubicité, information, etc).

Utiliser des tables de blocs de textes[modifier | modifier le code]

Les tables de blocs de textes sont indispensables dès lors que l'on veut étoffer un texte descriptif. Avec des données sèches, on a en effet vite fait le tour.

Modifier un modèle ou un article de WP[modifier | modifier le code]

  • en semi-automatique
  • en automatique

Le stade ultime, que je ne mets néanmoins pas en chapitre, est … la création d'articles sur Wikipédia en semi-automatique ou en automatique complet. A ce stade le contributeur dispose de tous les outils pour se lancer. De nombreux domaines s'y prêtent, le tout étant de disposer de données en fichier ou directement récupérables à la volet sur le web. Le niveau de détail et de wikification des articles dépend du temps que l'on souhaite consacrer à la constitution des bases de données annexes (blocs de textes, wikification, etc) sur lesquels viendra s'adosser le bot. Quelques exemples de domaines :

  • le cinéma (à partir des fiches ImdB) ;
  • Les espèces animales ou végétales ;
  • etc