Aller au contenu

Utilisateur:MisterMatt Bot/Fonctionnement

Une page de Wikipédia, l'encyclopédie libre.

Cette page explique le fonctionnement de certains modules du bot.

Catégorisation des ébauches

[modifier | modifier le code]

MisterMatt Bot regarde si une ébauche appartient à une catégorie spécifique qu'il reconnait. Si oui, il change le {{ébauche}} en {{ébauche le thème particulier}}.

Il utilise deux méthodes différentes pour voir à quel type d'ébauche correspond l'article :

  • une recherche utilisant les expressions régulières (regexp)
  • une recherche exhaustive sur un certain nombre d'article

Avec les expressions régulières

[modifier | modifier le code]

Si le titre d'une catégorie commence, finit ou tout simplement contient certains mots, alors le bot associe le type d'ébauche adéquat.

Une table de correspondance entre les types d'ébauches et les expressions régulières est donc nécessaire. Ce genre de table ressemble à cela :

    tableRegexp = {
        "religion"           => [
                                /Théologien(.*?)/i
                                ],
        "art"                => [
                                /^Peintre (.*?)/i,
                                /^Sculpteur (.*?)/i
                                ],
        "informatique"       => [
                                /(.*?)Informatique(.*?)/i,
                                /(.*?)Internet(.*?)/i,
                                /(.*?)Linux(.*?)/i,
                                /(.*?)email(.*?)/i
                                ]
    }

Avec la recherche exhaustive

[modifier | modifier le code]

Le bot regarde si le titre exacte d'une catégorie de l'ébauche correspond à une entrée dans une table de correspondance entre les différents types d'ébauches et les catégories.

Cette table de correspondance ressemble à cela :

    tableCat = {
    	"religion" => ["Religion","Pape"],
    	"sport" => ["Sport","Football"]
    }    

Dans ce cas de figure, après le passage du bot, les ébauches de Catégorie:Wikipédia:ébauche étant dans les catégories Catégorie:Religion ou Catégorie:Pape iront dans Catégorie:Wikipédia:ébauche religion.

  • L'ordre des lignes dans les tables est important. En effet, les dernières lignes ont le dernier mot. Autrement dit, si une ébauche appartient à deux catégories différentes, elle sera classée dans le type d'ébauche défini en dernier.
  • La recherche avec les expressions régulières est réalisée avant la recherche exhaustive donc cette dernière, jugée plus fiable, aura le dernier mot.