Aide:Pywikipedia/replace.py

Une page de Wikipédia, l'encyclopédie libre.

Replace.py est un script en Python pour les bots Pywikipédia. Ce script permet d'effectuer des remplacements de texte. Lorsqu'il est lancé, il récupère les informations sur les pages à modifier à partir d'un dump XML, ou d'un fichier texte. Il peut également modifier une seule page.

Ce bot peut être lancé à l'aide des paramètres suivants :

-xml
Récupère les informations à partir d'un dump XML local (pour les dumps, voir http://download.wikimedia.org/). L'argument est utilisé avec la syntaxe -xml:nomdefichier.
-file
Travaille sur toutes les pages listées dans un fichier texte local. Le script interprètera chaque lien wiki (entre doubles crochets) pour modifier les articles. L'argument est utilisé avec la syntaxe -file:nomdefichier.
-cat
Travaille sur toutes les pages qui appartiennent à la catégorie spécifiée. La syntaxe est -cat:nomcategorie.
-page
Modifie uniquement la page spécifiée. La syntaxe est -page:nompage. Cet argument peut être employé plusieurs fois pour éditer un nombre multiple de pages.
-ref
Travaille sur toutes les pages liées à la page spécifiée. La syntaxe est -ref:nompagereferee.
-start
Travaille sur toutes les pages du wiki, en partant de la page donnée. Choisissez -start:! pour commencer depuis le tout début. Cette option est à éviter, excepté dans le cas où il n'existe aucun dump XML récent.
-regex
Utilise des expressions rationnelles pour faire les remplacements. Si cet argument n'est pas donné, le bot fera des remplacements de texte basiques.
-except:XYZ
Ignore les pages qui contiennent XYZ. Si l'argument -regex est donné, XYZ seront considérés comme des expressions rationnelles.
-fix:XYZ
Effectue l'une des tâches prédéfinies, données dans le dictionnaire 'fixes' défini dans ce fichier. L'argument -regex et les remplacements spécifiés seront ignorés si vous utilisez -fix.
Les tâches prédéfinies actuellement disponibles sont :
  • HTML - convertit des balises HTML en code wiki, et corrige le XHTML.
-namespace:n
Numéro de l'espace de noms à traiter.
-always
Évite de devoir confirmer chaque remplacement. N'utilisez cet argument que si vous êtes certain que vous n'allez pas modifier certaines pages par erreur.
Autres arguments
Le premier argument est le texte initial (à corriger), le second est le nouveau texte. Si l'argument -regex est utilisé, le premier argument sera considéré comme une expression rationnelle, et le second pourra contenir des chaînes de caractères comme \\1 ou \g<name>.

Note : Utilisez l'un des arguments -xml ou -file ou -page, mais n'en utilisez pas plus d'un à la fois.

Si vous souhaitez changer des modèles de l'ancienne syntaxe (par exemple {{msg:ébauche}}) à la nouvelle syntaxe ({{ébauche}}), téléchargez un dump XML (table cur) à l'adresse http://download.wikimedia.org, puis utilisez la commande :

python replace.py -xml -regex "{{msg:(.*?)}}" "{{\1}}"

Si vous possédez un dump nommé foobar.xml et souhaitez faire des corrections typographiques (par exemple : Errreur → Erreur), utilisez la commande :

python replace.py -xml:foobar.xml "Errreur" "Erreur"

S'il y a une page appelée 'John Doe' et que vous souhaitez convertir les balises HTML en syntaxe wiki, la commande est :

python replace.py -page:John_Doe -fix:HTML

Si vous lancez le bot sans les arguments, les remplacements à faire vous seront demandés plusieurs fois :

python replace.py -file:blah.txt

Le script demande à l'utilisateur avant de modifier un article. Il est recommandé de vérifier le résultat pour être sûr que le bot n'a pas introduit des erreurs (en particulier avec des mots mal orthographiés).

Il est possible de spécifier un groupe d'articles avec un fichier texte externe, contenant des liens wiki :

 [[avion]]
 [[véhicule]]
 [[train]]
 [[automobile]]

Le bot est ensuite lancé à l'aide d'une commande du type :

python replace.py -file:liste_articles.txt "errreur" "erreur"

Le message visible dans les RC et l'historique sera alors automatiquement défini comme suit : (Robot : Remplacement de texte automatisé (-errreur +erreur)).