Utilisateur:Pmartin/Cache

Une page de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
WiKiwix   Wikipediaondvd   Cache

PDD en cours : Discussion Wikipédia:Prise de décision/Système de cache
Présentation du projet cache.

Depuis quelques mois, Linterweb a entrepris un travail sur les liens externes de fr.wikipedia.org Pour l'instant, cela prend la forme de remontée de ces liens au sein de wikiwix.com. Afin d'étudier la qualité de ces liens, nous nous aventurons dans la conception d'un moteur de recherche contenant ces liens. C'est ainsi que nous nous sommes aperçus que beaucoup d'entre eux était en erreur 404 (c'est-à-dire que les pages n'existaient plus), soit environ 5 %.


Parallèlement à notre travail, nous nous sommes aperçus qu'une partie de la communauté, dont le Projet:Correction des liens externes, travaillait d'arrache-pied sur la question et qu'une solution consistait à fournir un cache pour les liens externes.


Un cache est un outil de sauvegarde de données qui est utilisé par les moteurs de recherche et aussi par des sites comme internet archive. D'un point de vue de la légalité d'une telle sauvegarde, il semblerait qu'elle respecte le code html "no-archive" avant de sauvegarder le contenu. Le dossier est en cours d'étude par mon avocat spécialisé NTIC.

align


Pour tester le fameux cache et nous permettre de savoir si un tel outil a de l'avenir au sein de Wikipedia, je vous invite donc à tester le cache en plaçant loadJs("User:Pmartin/cache.js"); dans votre monobook et à venir nous faire part de vos remarques sur cette page.


Cela ajoute à côté de chaque lien externe un petit lien vert vers la page mise en cache par wikwix. Voici un exemple pris au hasard de cache.


L'intérêt du cache consiste à rendre fiables les sources internet de sorte qu'elles ne finissent pas en erreur 403, 404, 410 ou 500 lorsque le site est déplacé, supprimé, etc.


Cet outil n'est pas intrusif, c'est-à-dire qu'il ne fait pas de requêtes sur les serveurs de Wikiwix lorsqu'un internaute visionne un article de Wikipedia.


De plus seulement les liens externes contenu dans le namespace 0, c'est-à-dire celui des articles, sont mis en cache.


Lors de la suppression d'un lien externe dans un article, celui-ci sera effacé du cache de façon automatique après vérification que celui-ci n'est plus lié à aucun article.


Il y a la possibilité de désactiver le cache en ajoutant no_external_cache = true; à votre monobook.


Cordialement, Pmartin (d) 19 août 2008 à 14:53 (CEST) et Dodoïste [réveille-moi] 21 août 2008 à 06:50 (CEST)

Mais les liens que j'ai indiqué dans la page concernant Victor Ernst NESSLER, renvoient à mon site Généanet personnel..... et je suis d'accord pour qu'on y accède ! Alors, y a-t-il moyen de supprimer ce cache ? Que doit-on faire ? Tout cela devient bien compliqué, savez-vous ! Cordialement. Jean-Pierre BERNARD.

C'est pas bien que ce message « Vous êtes en train de consulter une version archivée de cette URL.

Elle apparaît ci-dessous telle qu'elle était lorsqu'elle elle a été insérée comme lien externe dans Wikipedia.

Vous trouverez des informations et pouvez donner votre opinion sur le cache sur cette page. | Si vous souhaitez interdire la mise en cache de ce site, merci d'utiliser le formulaire de blocage de site. » reste toujours présent quelque soit où l'on navigue dans la page. J'ai essayé de le faire disparaitre ce message avec l'extension firefox « element hiding helper pour adblock plus » mais ça efface le message et le contenu de la page. Merci de faire en sorte que ça change.

C'est pas bien, il y a des pages qui ne sont plus présente dans archive.wikiwix.com, alors que ça dérange. Sans le consentement, la page disparait, c'est peut-être un abus de censure du net par l'homme qui interdit au bot de travailler pour la sauvegarde du contenu du net. MerveillePédia dial. 18 janvier 2014 à 14:40 (CET)
Grand bandeau qui gêne, des archives fait par wikiwix.com. Ce bandeau c'est toujours affiché avant le 19 janvier 2014.
@ Pmartin il existe un lien pour interdire la mise en cache par wikiwix. Et il y a une page de données météo, qui me semble suspecte pour sa disparition de wikiwix.com. C'est vraiment pas bien, on ne connaît pas la raison de la non disponibilité d'une page en archive de wikiwix.com. Et puis internet est mal fait, par exemple en clic de nombreuses fois sur un lien Youtube en s'attendant à voir une vidéo est à la place on un message « droit d'auteur donc pas visionnable » « payant donc pas visionnable », ça fait perdre du temps, j'en voie pas l'intérêt, peut-être qu'il n'est pas possible de faire autrement.
Merci de coder différement afin que ce grand bandeau ne dérange plus.
Est-ce qu'on pourrait faire par exemple un détecteur de lien mort, par exemple un lien avec un contenu que l'on ne peut plus voir s'affiche en police orange au lieu de bleu afin de ne pas cliquer sur un lien mort (gain de temps pour l'internaute) ? MerveillePédia dial. 20 janvier 2014 à 10:56 (CET)
Ce bandeau contient les informations légales ( lien qui permet de retourner à la page d'origine, informations expliquant aux internautes qu'il n'est pas sur la page qui a généré le contenu ), il n'est pas là pour être joli mais plutôt pour être sans équivoque. Le seul cas où nous retirons de la data des archives c'est quand le propriétaire fait exercer son droit de retrait, donne moi le lien (soit vers wikiwix soit vers le site de météo ) et je regarderai . Si une source devient payante s'est indépendamment de ma volonté mais elle en reste néanmoins source et permet aux utilisateurs d'y accéder quand même. Le système que tu évoques de coloration des liens serait intrusif pour la communauté wikipedia, c'est à dire qu'à chaque requête sur une page, il y aurait plein de demande vers wikiwix pour connaitre l'état du lien, ce qui ralentirai l'affichage des pages. J'espère avoir répondu à tes questions, et mes excuses du délai de réponses mais j'avais zappé ton message car il est tombé en plein dans mon déménagement :) --Pmartin (discuter) 26 mars 2014 à 04:39 (CET)