Utilisateur:Salebot/À faire

    Une page de Wikipédia, l'encyclopédie libre.
    • Traitement majuscules : détecter \[a-z], pas seulement \b
    • Rapport sur "cas louches" ?
    • Mettre un bandeau méchant et écrire sur WP:RA en cas de récidive nette
    • utiliser {{CURRENTDAY}}, etc. pour les journaux
    • Gestion de l'heure (MT, UTC, CET)
    • Lien vers "false positives", cf. cluebot http://en.wikipedia.org/w/index.php?title=Black_Thursday&curid=2547445&diff=176189526&oldid=176189508
    • Nouveaux comptes contribuant sur un sujet/article "chaud" donné
    • Détecter les renommages faits par copier-coller par des participants inscrits (suppression de x chars, puis ajout de x chars ailleurs, ou ordre inverse, avec une marge)
    • Détecter lorsque le bot se fait révoquer par un utilisateur de confiance, effacer le casier de l'IP révoquée par le bot
    • Analyse par chaînes de Markov
    • Analyse par réseau de neurones (en:User:Cobi)
    • Détecter l'insertion ou la modification d'images, signaler comme les annonces de mort
    • IP scolaires
      • Détecter les IP scolaires à partir du FQDN (ac-*.fr), ajouter les bandeaux
      • Rapporter les modifs d'IP scolaires à partir de la catégorie
    • Détecter les pages sensibles (révocations, protections) et abaisser le seuil
    • En mode hargneux, ne pas révoquer la pdd de l'utilisateur
    • Suivre Wikipédia:Détection des proxy ouverts et marquer les IPs correspondantes
    • Détecter les guerres d'édition
    • Copyvios: Yahoo BOSS, http://developer.yahoo.com/search/boss/
    • Bandeau d'info quand un article est supprimé et qu'il n'y a qu'un seul participant
    • Si la modif reprend des mots de l'article, elle est probablement bonne (sauf les noms de personnes ?)
    • Articles sensibles : annuler les contributions de nouveaux utilisateurs ou d'IPs n'ayant pas participé auparavant
    • Lister certaines classes de vandalismes sur une page dédiée, par exemple pour suivre certains vandales de longue durée
    • Bug dans l'affichage des renommages
    • Rajouter des NOINDEX en haut de chaque page du journal (fait pour les nouvelles pages)
    • Détecter les modifications de nombres sur plusieurs articles
    • Formatter les résultats de vandalism.pl, probablement en XML (argl)
    • Détecter l'ajout du même texte sur plusieurs pages (exception pour les catégories et bandeaux)
    • Publier le détail des alertes sur IRC, au moins pour les cas "temporaires"
    • Déplacer certains paramètres (pages "auto-défense") sur le wiki
    • Commande !test diff_url qui envoie le résultat sur le wiki
    • Stocker un jour entier sur log-rc.txt pour lancer un parser dessus (détection de tous les types d'actions)
    • watchlist, les modifs d'utilisateurs suivis sont affichées avec "suivi"
    • Table RC: diff, reverted_by_human, reverted_by_bot. Permet de simuler un nouveau jeu de regex. Permet d'ajuster les scores (si une expression est toujours révoquée par un humain, augmenter la v.a. du score ; inversement pour éviter les faux positifs)
    • Changer le traitement des majuscules
    • sprintf localisé du genre "{loc} : %s" où {loc} est une clé
    • Tronquer automatiquement le journal des modifications suspectes
    • Class::DBI pour transformer %userdb en objet lié à une base de données
    • Mise à jour automatique de {{WikiDefCon}}
    • Mesurer les distances de Levenshtein
    • Option ignore1RR pour certaines regex
    • Ajouter un mode où le bot lit les modifs d'une IP, mais n'affiche rien si le score est > 0
    • Bandeau quand qqn rajoute un lien externe en 1ere modif
    • Table pages: creation_time, deletion_time, recent_revert_count, last_activity
    • Réduire la sensibilité pour les suppressions d'interwikis, cf. http://fr.wikipedia.org/w/index.php?title=Nanami&diff=next&oldid=36931922
    • Vérifier que la révocation a réussi, ou que quelqu'un d'autre l'a faite, sinon recommencer
    • Purger les données anciennes de la bdd
    • Compter les différents types d'action - si 0, risque d'erreur du parser
    • Message différent si l'utilisateur a déjà été révoqué sur l'article (--> le bot ignore la R1R)
    • Séparer les tests (vandalism.pl est un test, il y en a d'autres) ; changer le calcul du résultat (n-uplet de scores, pas score total)
    • Afficher les renommages
    • Recréation d'un article supprimé
    • Alerte pour page souvent modifiée par IPs/débutants (détection attaque jeuxvideo)
    • Le bot affiche parfois "la révocation a échoué" par erreur
    • Quand un message est tronqué dans le journal, garder la fin
    • Utiliser une nouvelle table SQL pour les stats (grouper par jour ?)
    • Utiliser un maximum de paramètres de configuration directement sur le wiki
    • Détecter la suppression d'une image se trouvant toujours sur commons
    • "Maladresse" et "vandalisme apparent"
    • Mesure du lag entre rc et message irc
    • Dans vandalism.pl, ne pas utiliser le diff fourni par wp, mais comparer les versions n et n-1, et évaluer les regex sur les blocs qui sont différents, pour voir quelles regex apparaissent ou disparaissent.
    • Utiliser deux comptes IRC: un pour les messages importants, un pour les autres, pour éviter le throttling anti-flood
    • Traiter les blanchiments comme des rv
    • Lorsqu'un autre participant révoque sur la même page que le bot, prévenir l'utilisateur que le bot ignorera la R1R
    • Ne prendre en compte les modifs patrouillées que lorsqu'il s'agit de la dernière version
    • Marquer comme patrouillées les modifications annulées (y compris quand plusieurs modifs sont annulées d'un coup)
    • Quand une page est blanchie après SI, indiquer le motif de la SI avec le bandeau de blanchiment.
    • Quand une page est restaurée après SI, ne pas la blanchir

    Fait[modifier | modifier le code]

    • Tri des annonces par date (pointeur sur journal, détails sur journal/yyyy-mm-dd)
    • Changer les tags, du genre [namespace=0], [category=vandalism]
    • Gérer les nouvelles pages, pas seulement les modifications
    • Sur IRC, au lieu du score, mettre des étoiles
    • Vérifier ceci : plein de "je", "moi", "tu", un "je t'aime", et un "nique"... le bot a détecté des changements dans des paragraphes inchangés. --Gribeco 14 novembre 2007 à 02:58 (CET)
    • Mettre le bandeau en haut de la page de discussion
    • Poser le bandeau après {{IP partagée}} ou {{IP scolaire}}
    • Ne pas redémarrer en cas d'erreur de syntaxe (perl -c)
    • Pondérer le score en fonction de la taille de la modif (grosse modif = plus de chances de tomber sur des regex qui font tiquer le bot)
    • Révoquer proprement (jamais vers le même utilisateur)
    • Détection des révocations (admins, LiveRC) et ajustement du score
      • Ignorer la 1RR quand une révocation humaine a déjà eu lieu
    • Corriger l'enregistrement du bot sur IRC
    • Nombre de regex par rapport à la taille du delta
    • Nombre de regex + / -
    • Avertir des blanchiments (même partiels) sans commentaires
      • Laisser une IP blanchir son propre article
    • Corriger "score final" (contenu, page, utilisateur)
    • Détecter quand l'edit token est périmé ou invalide
    • Bug bandeaux sur Discussion Utilisateur:195.25.237.113
    • Bandeau pour catégorie ou image à corriger, ex. Discussion Utilisateur:88.123.40.32
    • Étendre la détection aux newbies
    • Séparer la détection dnsbl dans un nouveau package
    • Détecter les renommages en masse
    • Détecter les nouvelles pages et les importations faites par des débutants ou des IPs
    • Quand une expression est enlevée, inverser son score
    • vandalism.pl : séparer/regrouper par classe, pour mettre les annonces de mort sur "modifications suspectes"
    • Détection de bas de page supprimé, cf. http://fr.wikipedia.org/w/index.php?title=Les_Herbiers_Vend%C3%A9e_Football&diff=32574925&oldid=31646031
    • Meilleure explication ; grouper les détections et scores par catégorie (vandalisme, erreur, ...)
    • Détecter les contrefaçons du bandeau du bot
    • Avertissement sur gros ajout (même si le score est > 0)
    • whitelist_exp -> whitelist_exp_time
    • supprimer last_edit_time_str
    • Message IRC spécifique pour les blanchiments effectués par le bot (au lieu de "révocation")
    • Utiliser MediaWiki::API
    • Mettre les alertes (en plus des révocations) sur le journal, pour qu'elles soient lues par LiveRC et signalées à ses utilisateurs
    • Mieux surveiller Utilisateur:Salebot/Journal -- semi-protection à partir du titre
    • Ajouter le score dans le résumé
    • bug format: "retour à la version 33897039 deSalebot" (espace)
    • Inidiquer la raison et le score dans le résumé de blanchiment
    • Envoyer le détail des erreurs de détections (en particulier les erreurs de regex) sur IRC
    • Tronquer les entrées de journal trop longues
    • placer les avertissements du bot en dessous du bandeau {{Avertissement effacé}}
    • .config commun et overrides par langue
    • Bandeau utilisateur en cas de révocation systématique
    • Actions d'admins et d'utilisateurs expérimentés en vert (révocations, suppressions)
    • Annoncer les blocages quand l'utilisateur est dans la bdd
    • Signaler en rouge les révocations faites par un débutant ou une IP
    • Alerte pour modification de catégorie
    • Pour le spam, tenir le compte du nombre pages modifiées
    • Erreur en ajoutant le ":" aux catégories et aux images
    • Problème avec !wl (pas enregistré dans la bdd ?)
    • Gestion des patrolled edits (modifs vérifiées) maintenant qu'elles sont publiées sur IRC
    • MediaWiki::API : http://www.mediawiki.org/wiki/API:Query_-_Properties#revisions_.2F_rv pour lire une ancienne version (rvstartid/rvendid)
    • Modifs avec/sans bot flag ("&bot=0")
    • Commande pour ne plus afficher les suppressions -- mieux, afficher les suppressions pour les pages récemment modifiées seulement
    • Test 2020-07-19