Wikipédia:Bot/Requêtes/2016/05

Une page de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
État des requêtes
Requête en cours de traitement En traitement
Requête traitée Traitée
Requête refusée Refusée
Requête en attente d'informations complémentaires Attente d’infos
Requête démarrée puis mise en instance En pause
Requête arrêtée suite à un problème Arrêt / Panne
Requête à archiver sans suite En sursis
Requête non prise en charge depuis un moment Oubliée ?
Requête non prise en charge par un bot Caduque
Requête à archiver sans suite Sans suite
Pages mensuelles : 01 02 03 04 05 06 07 08 09
Archives  : 01 02 03 04 05 06 07 08 09

Requête en attente d'informations complémentaires Vérification et traitement des liens morts[modifier le code]

Demande du 20 mai 2016, par : — Oliv☮ Éppen hozzám? 20 mai 2016 à 17:28 (CEST)

Références ou discussions / décisions justifiant la demande :

Nature de la demande et discussion éventuelle :
Je vois sur des pdd d'articles en.WP les rapports d'un bot qui change les liens morts en liens archive.org : voir ci-dessus le lien de la procédure d'autorisation de en:User:Cyberbot II pour faire ça. Si l'idée plaît à un dresseur de chez nous on pourrait faire pareil ici aussi, tout en profitant de leur expérience (démarrage en août dernier). — Oliv☮ Éppen hozzám? 20 mai 2016 à 17:28 (CEST)

Notification Oliv0 : il est possible de demander une intégration sur notre wiki (voir phab:T136130) avec une décision communautaire. --- Framawiki 25 mai 2016 à 13:50 (CEST)
Bon d'un autre côté ici on a le gadget ArchiveLinks par défaut, alors le seul intérêt serait que ce soit sur archive.org plus riche/durable sans doute que wikiwix.com. — Oliv☮ Éppen hozzám? 25 mai 2016 à 14:25 (CEST)
Marrant que tu postes ça maintenant, je travaillais justement depuis deux semaines à la création d'un script pour parcourir tous les articles de frwiki, repérer les liens morts, et en fonction de comment est placé le lien, le mettre dans le modèle {{Lien brisé}}, {{Lien archive}} ou le signaler sur la pdd pour les un traitement manuel.
J'ai fais des tests de crawl à petite échelle, mon script est capable de traiter 20 pages par secondes, soit une vérifications de tous les liens de frwiki en une journée.
— 0x010C ~discuter~ 25 mai 2016 à 22:54 (CEST)
Note : je ne surcharge pas les serveurs de la fondation avec ce script, je récupère les pages 5000 par 5000 (c'est à dire je fais une requête pour récupérer en une fois 5000 pages). — 0x010C ~discuter~ 25 mai 2016 à 23:15 (CEST)
Bonjour Notification Oliv0 : Notification 0x010C : Notification Framawiki : Le fait de remplacer les liens externes morts par des liens directement vers archive.org est excessivement dangereux du point de vue du droit d'auteur en France, car archive.org ne respecte pas les standards de l'archivage des données comme je le démontre sur cette conversation https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Le_Bistro/4_mars_2016#Liens_morts.2C_que_faire_.3F . De plus cette conversation fait apparaître que des fois les sites ne sont plus opérationnels temporairement et que du coup un robot qui change automatiquement les liens externes, c'est augmenté le risque des problèmes. La presse internationale est entrain de s'organiser via le http://www.cfcopies.com/ car le droit français sur les droits d'auteur est l'un des plus protecteurs. En outre, les développeurs de wikimedia ont acté une aide technique à archive.org https://meta.wikimedia.org/wiki/2015_Community_Wishlist_Survey/Bots_and_gadgets#Migrate_dead_links_to_Wayback_Machine, certainement pour que ce partenariat qui n'est pas officiellement annoncé côté Fondation Wikimedia puisse aboutir https://blog.archive.org/2015/10/21/grant-to-develop-the-next-generation-wayback-machine/. Je trouvais que la solution que je proposais, était bien plus équitable dans le vote plutôt qu'une solution unilatérale de remplacer tous les liens morts par un lien vers Archive.org. --Pmartin (discuter) 27 mai 2016 à 14:39 (CEST)
PS Notification 0x010C : tu as çà pour récupérer tous les liens externes https://dumps.wikimedia.org/frwiki/20160501/frwiki-20160501-externallinks.sql.gz.--Pmartin (discuter) 27 mai 2016 à 14:47 (CEST)
@Pmartin C'est (en partie tout du moins) pour cela que mon script va essentiellement tagger les liens en questions avec le modèle {{Lien brisé}}, qui invite à une correction manuel, en plus d'un signalement en pdd. Le dernier truc qu'il me reste à faire est l'identification des cas où un remplacement par un lien vers une archive est directement possible, mais plus j'avance plus le nombre de liens concernés diminuent... — 0x010C ~discuter~ 27 mai 2016 à 17:00 (CEST)
et oui je connais l'existance de ce dump, mais je préfère utiliser directement l'API car elle est toujours à jour, le script peut fonctionner en toute autonomie et cela rend le portage sur un autre wiki plus aisé Clin d'œil — 0x010C ~discuter~ 27 mai 2016 à 17:03 (CEST)
@0x010C Oui d'autant plus que ce qui a de la valeur dans l'archive c'est au moment que quand un wikipédien source un article qu'il faut stocker son contenu, de nombreux documents ont été modifiés ( voire affirme le contraire de ce qu'un Wikipédien a voulu écrire ) suite à leur apparition dans wikipedia, d'où l'intérêt de proposer une archive conforme au moment de l'apparition du lien. D'ailleurs cette stratégie semble gêner certaines personnes qui aimeraient bien voir mourir notre espace de stockage depuis 2008 certaines collusion existe du côté de San Francisco entre les géants américains http://rue89.nouvelobs.com/2016/02/26/crise-a-fondation-wikimedia-directrice-demissionne-263290 sur les travaux de Linterweb. Vouloir couper la tête à un système, sans le refondre ne sert à rien. Je suis d'ailleurs surpris que des robots travaillent sur l'édition massive d'articles en remplaçant les liens morts par un liens vers un service d'archivage alors que le modèle {{Lien brisé}} existe qui est équitable. --Pmartin (discuter) 27 mai 2016 à 18:02 (CEST)
Le robot WP anglais fonctionne depuis août sans problème, voir sa discussion d'approbation quant aux problèmes soulevés ici comme les sites temporairement indisponibles. — Oliv☮ Éppen hozzám? 30 mai 2016 à 21:09 (CEST)
J'alerte juste que du point de vu légal que la solution que tu pousses à avancer peut être considéré comme du recel et que l'ensemble des personnes qui voteront favorablement à ce type de changement d’éditions massif seront légitiment responsable. Car ce que je dis est vrai archive.org ne gère plus les métadonnées aux détriments du droit comme je l'ai indiqué dans la conversation sur le bistro. Et puis cela ne résout en rien les changements de sources intervenues pour cacher une certaine vérité édité par les wikipediens que wikiwix est le seul à garantir. Ce que pousse Notification 0x010C : Notification Framawiki : sont en accord avec ce que propose à savoir un vote concernant le changement d'édition et/ou l'utilisation du modèle lien brisé {{Lien brisé}}, si tu t'entêtes dans cette voie tu vas vers un carnage personnel car tu n'averties pas les personnes qui ne sont pas d'accord avec toi et avec les problèmes de justices qui sont à venir en cas d’exécution de ton choix délibéré malgré 3 personnes contres. Notification Oliv0 : --Pmartin (discuter) 2 juin 2016 à 02:40 (CEST)
Je ne pousse rien (c'est toi qui pousses ton site wikiwix.com) mais c'est ridicule de dire qu'utiliser archive.org comme fait en.WP est illégal, alors qu'ils sont tellement regardants là-dessus qu'ils ont même blacklisté archive.is que nous on recommande via {{lien mort}}. — Oliv☮ Éppen hozzám? 2 juin 2016 à 07:59 (CEST)
La communauté anglophone soutient un système qui n'est pas équitable, car lors de ce vote elle n'aurait d'une part pas clôturé celui-ci après ma position https://meta.wikimedia.org/wiki/2015_Community_Wishlist_Survey/Bots_and_gadgets#Migrate_dead_links_to_Wayback_Machine et d'autre part pas non plus privilégié le monopole vers un et unique archiveur. J'ai alerté l'équipe mise en place par la Fondation en charge du projet, sur les pratiques illégales d'archive.org sur le fait que archive.org stocke malgré une interdiction des éditeurs de sites par la métadonnée "noarchive" ex https://web.archive.org/web/20160305111325/http://www.sudouest.fr/2016/03/04/mais-au-fait-quel-est-le-programme-de-donald-trump-2291267-4803.php http://www.sudouest.fr/2016/03/04/mais-au-fait-quel-est-le-programme-de-donald-trump-2291267-4803.php http://archive.wikiwix.com/cache/?url=http://www.sudouest.fr/2016/03/04/mais-au-fait-quel-est-le-programme-de-donald-trump-2291267-4803.php elle n'a pas tenu compte de mes remarques. Je ne pousse pas à ma solution puisque le modèle que je propose soutenu par Notification 0x010C : est une solution qui met en avant l'ensemble des archiveurs et qui par simple modification du modèle {{Lien brisé}} permet l'ajout et la suppression de ce type de service, alors que la solution que tu proposes va changer des centaines de milliers de liens au sein même de l'encyclopédie aux détriments des droits d'auteurs des éditeurs de sites.--Pmartin (discuter) 2 juin 2016 à 13:36 (CEST)
Moi je dis juste que j'aime bien le robot anglais qui met automatiquement dans les modèles biblio et les liens externes un site d'archivage au lieu du lien mort, parce qu'on tombe souvent sur des liens morts. D'ailleurs un de tes liens m'indique que le souhait n°1 de la communauté Wikimédia en 2015 est Migrate dead external links to archives/phab:T120433 : en gros c'est en train de se faire de toute façon.
Maintenant, quel site d'archivage privilégier pour Wikipédia comme le plus fiable sur la durée parmi archive.org, archive.is, ton site wikiwix.com ou d'autres solutions, c'est une autre question qui serait à argumenter ailleurs qu'ici, sur une page de discussion appropriée où il y aurait quelques utilisateurs qui s'y connaissent sur ces questions. — Oliv☮ Éppen hozzám? 2 juin 2016 à 15:26 (CEST)
https://en.wikipedia.org/wiki/Pratfall_effect#cite_ref-12 oui c'est vrai le CyberbotII est fiable il a changé un lien mort qui ne l'était pas cf la note 12. On va devoir regarder un par un les liens qu'il change. J'ai averti les gestionnaires du projets de ce type de problème mais la volonté du passage en force est bien plus forte.--Pmartin (discuter) 24 juin 2016 à 14:15 (CEST)
Pourquoi faut-il en privilégier un? Pourquoi ne pas utiliser plusieurs sources d'archivage?190.246.140.132 (discuter) 25 juin 2016 à 04:20 (CEST)

@tous Cette demande est-elle toujours d'actualité ? ---- VänBrøøken Blason ville ca Chicoutimi-Nord (Québec).svg (diskusjon) 21 juillet 2016 à 01:58 (CEST)

Le souhait communautaire n°1 de 2015 l'est (= phab:T120433 ouvert, demandes du bot anglais sur phab:T136130), et 0x010C (d · c) travaillait à un bot. — Oliv☮ Éppen hozzám? 21 juillet 2016 à 07:49 (CEST)
Ce n'est pas un vote de la communauté francophone, une minorité de contributeurs francophones ont participé à ce vote, et si c'est pour changer des faux liens morts par des liens vers [archive.org] comme cette source https://en.wikipedia.org/wiki/Pratfall_effect#cite_ref-12 cela ne sert à rien. Et je ne parle même pas du coût énergétique engendré par la solution pour vérifier les milliards de liens à l'échelle de wikipedia qu'il va falloir tester en boucle pour savoir si ils sont morts ou pas ou peut - être, laisser un projet comme celui - ci se développer c'est positionné Wikipedia vers l'un des sites les plus polluants de la planète. Donc non Notification VanBrooken : ce projet n'est plus d'actualités tant qu'il n'y aura pas de réflexion plus pousser sur ce projet qui contient énormément de bug que nous ne pouvons pas contrôler. Pmartin (discuter) 30 juillet 2016 à 03:42 (CEST)

Suivi de la demande :